Google I/O: Recap i principals novetats de Google per a enguany
Aquest dimarts 14 de maig es va celebrar la conferència anual de Google per a desenvolupadors: Google I/O 2024. En aquesta conferència, la companyia anuncia les principals que han llançat o llançaran en les seves aplicacions, des de la cerca de Google, fins a Gmail o Google fotos.
IA Generativa
Com no podia ser d’una altra forma, la IA Generativa va ser el tema estrella de la conferència de Google I/O 2024. Entre les principals novetats relacionades amb la IA Generativa que el gegant tecnològic va anunciar, destaca:
Nova versió disponible de la IA Generativa de Google: Gemini 1.5 Flaix i 1.5 Pro
Google va anunciar Gemini 1.5 Flash i 1.5 Pro, la nova versió de Gemini, el seu model de IA Generativa, una nova versió que indiquen que és més ràpida i eficient i que està disponible en més de 35 idiomes. Tant 1.5 Pro com 1.5 Flaix estan disponibles en vista pública amb una finestra de context d’un milió de tokens en Vertex AI i a AI Studio – actualment, molt més gran que qualsevol altre a dia d’avui.
A més, també van anunciar que estan integrant aquesta versió d’1.5 Pro en els productes de Google, inclosos Gemini Advanced i les aplicacions Workspace.
Concretament, amb aquest nou model indiquen que Gemini Advanced podrà ajudar en tasques com:
- Com a analista de dades: revelant tendències i creant visualitzacions personalitzades sobre la marxa a partir dels arxius de dades que hagis pujat, com a fulls de càlcul.
- Interpretant imatges: Gemini és multimodal de manera nativa, i el model 1.5 Pro aporta grans millores en la comprensió d’imatges. Per exemple, pots fer una foto a un plat del teu restaurant favorit i demanar la recepta, o fer una captura d’un problema matemàtic i obtenir instruccions pas a pas per a resoldre’l. Tot això a partir d’una sola imatge.
Google presenta PaliGemma i Gemma 2
Gemma són un conjunt de models oberts d’intel·ligència artificial (IA) lleugers i generatius. Els models de Gemma estan disponibles per a executar-se en aplicacions i en el hardware, en dispositius mòbils o en serveis allotjats. Els usuaris poden usar models de Gemma per a casos d’ús de generació de codi, però també per a altres funcionalitats, com per a millorar el rendiment en tasques específiques. En conclusió, l’objectiu d’un model de Gemma ajustat, segons Google, té l’objectiu de poder ajudar a quines solucions de IA generativa siguin més orientades i eficients.
A Google I/O 2024, Google va presentar l’última versió de Gemma, amb Gemma 2, i una expansió amb PaliGemma.
PaliGemma és un model optimitzat per a la interpretació d’imatges. Concretament, està dissenyat per a oferir un rendiment de precisió per a tasques de visió-llenguatge. Això inclou funcionalitats com el subtitulat d’imatges i vídeos curts, la resposta a preguntes visuals, la comprensió de text en imatges o la detecció i segmentació d’objectes.
Google inclourà una marca d’aigua a les seves imatges generades amb IA
Google va anunciar que obrirà el codi de SynthID, la seva eina de marca d’aigua capaç de determinar si una imatge ha sigut generada per intel·ligència artificial.
Més allà de la IA Generativa
Encara que les novetats en IA Generativa van ser els temis estrelles de Google I/O 2024, la companyia també va presentar altres novetats destacades.
Seria el cas de les novetats en desenvolupament mòbil i Android, on Google va anunciar que ha potenciat les experiències de desenvolupament mòbil per a Android mitjançant APIs avançades, eines i guies que milloren la productivitat dels desenvolupadors, destacant que, pròximament, Gemini en Android Studio suportarà entrades multimodals usant Gemini 1.5 Pro, la qual cosa promet revolucionar encara més el desenvolupament en Android.
Finalment, Google també va introduir Project IDX en beta oberta per a oferir una experiència de desenvolupament simplificada en aplicacions full-*stack i multiplataforma, integrant eines com Chrome DevTools i Cloud Run. A més, Firebase ha evolucionat per a suportar aplicacions modernes impulsades per IA, permetent connectar amb bases de dades PostgreSQL i facilitant desplegaments segurs i escalables des de GitHub. També s’han millorat les eines de Flutter i Dart per a oferir un rendiment gràfic i d’aplicacions notablement superior, juntament amb noves funcionalitats experimentals per a optimitzar l’experiència de desenvolupament en Dart.