Indica un intervallo di date:
  • Dal Al
tecnologia

Da Project Astra a Veo. Tutte le novità di Gemini presentate al Google I/O 2024 in sei video

Eravamo rimasti pochi mesi fa a dicembre scorso con il primo modello multimodale Gemini 1.0 in tre diverse versioni: Ultra, Pro e Nano. In meno di sei mesi abbiamo conosciuto Gemma i loro chatbot open source e Gemini 1.5 Pro, caratterizzata da migliori prestazioni e capacità di ragionamento multimodale. Con l’ultimo Google I/O di maggio numerose nuovi chatbot e tecnologie di intelligenza artificiale generativa sono state rilasciate. Ecco in sintesi le novità.

Cosa è Gemini 1.5 Flash? E’ un modello più leggero rispetto a 1.5 Pro e progettato per essere veloce e più facilmente distribuibile a scala.

 

 

Project Astra. E’ un progetto per costruire un agente AI tuttofare. Siamo entrati nell’era degli assistenti di AI che affiancheranno gli utenti nella vita quotidiana (attraverso lo smartphone o un paio di occhiali intelligenti) con doti estremamente avanzate per recepire e ricordare ciò che vedono, comprendere il contesto e agire imparando dal dinamismo dell’ambiente in cui operano.

Cos’è Gemini Live? Questo è il prodotto Google più paragonabile a GPT-4o, una versione del modello AI dell’azienda con cui puoi parlare in tempo reale. Google afferma che sarai anche in grado di utilizzare lo strumento per comunicare tramite video in diretta “entro la fine dell’anno”. L’azienda promette che sarà un utile assistente alla conversazione per cose come prepararsi per un colloquio di lavoro o provare un discorso.

Ecco Gemma 2. Siamo già alla secondo versione della nuova generazione di modelli aperti che sfrutta anche una nuove architettura dedicata.

Gemini in Workspace. Le funzionalità di Gemini saranno disponibili per un maggior numero di utenti e si integreranno nel pannello laterale di Gmail, Documenti, Drive, Presentazioni e Fogli. Le funzionalità di Gemini saranno aggiunte anche all’app mobile di Gmail

 

Cosa è Veo? E’ un  nuovo modello text-to-video progettato per competere con Sora di OpenAI e altri modelli di generazione video quali Pika, Runway e Irreverent Labs. È capace di catturare diversi stili visivi e cinematografici, inclusi paesaggi e time-lapse. Veo è basato sui modelli di generazione di video, tra cui Generative Query Network (GQN), DVD-GANImagen-VideoPhenakiWALTVideoPoet e Lumiere, e offre una combinazione di architettura, leggi di scala e altre tecniche innovative per migliorare la latenza e la risoluzione dell’output.


Ecco Music Ai Sandbox. In questo blog abbiamo tracciato molti progetti di Ai generativa applicati alla musica perché lo consideriamo un campo di grandissimo interesse. Google in partnership con YouTube,  sta sperimentando “cose” nuove con alcuni  musicisti, autori e produttori. Lyria, è la famiglia di modelli più avanzata per la generazione di musica con l’IA.

Nell’ambito di questo lavoro, è nata la suite di strumenti per la musica Music AI Sandbox. Questi strumenti sono pensati per offrire nuove possibilità creative, permettendo alle persone di creare da zero nuove sezioni strumentali, trasformare il suono in nuovi modi e molto altro ancora.

Come funziona Ai Overview.  Precedentemente nota come Search Generative Experience (SGE)  Ai Overview ha spiegato la nuova capa di Google Search Liz Reid “Può toglierci gran parte del duro lavoro della ricerca, in modo che possiamo concentrarci sulle parti che vogliamo fare per completare le attività o sugli aspetti dell’esplorazione che troviamo più entusiasmanti”. Le demo che sono state mostrate e che potete vedere qui sotto indicano la capacità di riassumere la risposta alla nostra domanda insieme a link per approfondire. Quindi non siamo completamente dentro all’Ai generativa, la risposta non è solo testo in linguaggio naturale ma ci sono anche i link. Un modo per “salvare” l’esperienza e i punti di forza della ricerca di Google. Qui il post di Info Data

Per approfondire. 

AI Overview, come cambia il motore di ricerca di Google con Gemini?

Arriva Gpt-4o, ecco cosa ha di diverso il nuovo chatbot di OpenAI

Cosa è Microsoft Places? Ecco come funziona la nuova applicazione per la gestione dei luoghi

Come si installa e come funziona Phi-3 di Microsoft #DatavizAndTools

Come funzionano le nuove estensioni di Gemini?

Gpt-4, Gemini e Gemini 1.5 Pro. Scopri le differenze

Cerchia e cerca e altre novità Ai di Google sui telefonini Android

Come funziona Sima la nuova Ai di Google che completa i videogiochi al posto vostro

Come funziona e a cosa serve Ecco lo European Statistical Monitor?

Claude 3 di Anthropic è più potente di ChatGPt? Ecco quello che c’è da sapere.

Nasce Genie, il modello di Ai per creare videogiochi da una singola immagine

Ecco cosa promette il generatore di immagini Stable Diffusion 3

Gemma 2B e Gemma 7B. Ecco cosa si può fare con i modelli open source di Gemini

Da Adobe domande e riassunti con l’Ai gen su documenti Pdf

Nasce Sora il modello text-to-video di OpenAi. Ecco come funziona

Come funziona Lumiere l’Ai di Google che genera video dal testo #DatavizAndTools

Microsoft Copilot ora è su tutti gli smartphone. #DatavizAndTools 

Come funzionano Nightshade e Glaze? #DatavizAndTools

Fotoritocco, come funzionano Abobe Photoshop Elements e Premiere? #DatavizAndTools

Ecco come funziona Q il nuovo chatbot di AWS? #DatavizAndTools

Ecco come funziona Microsoft 365 Copilot, l’AI generativa entra nelle app di Office

Ecco come funziona GraphCast il nuovo modello per le previsioni meteorologiche globali di DeepMind

Cosa è e come funziona Code Interpreter per Gpt-4?

Come riconoscere immagini e testi generati dall’AI?

La matematica della ricchezza, la disuguaglianza inevitabile e l’econofisica

Wikipedia, l’intelligenza collettiva e gli affari #datavizandtool

Da Harry Potter mafioso agli ultimi videogiochi ripensati a 8 bit. L’Ai generativa continua a divertire #datavizandtools

Come si costruisce una mappa di Milano con ChatGpt? #datavizandtools

Come funziona MusicGen, il ChatGpt della musica di Meta #DatavizandTools

Bing, come funziona il copilota di Microsoft per il web? #DatavizAndTools

Le ultime novità “audio” dell’Ai generativa #DatavizAndTools

Gpt-4 vs Bard, cinque domande: chi risponde meglio? #howmeasuring

A proposito di mappe, cosa è Overture Maps Foundation? #DatavizAndTools

Ecco le nuove funzionalità di intelligenza artificiale generativa di Photoshop

Come funziona Image, il creatore di mappe di Eurostat?

Come si visualizzazione le serie storiche?