Google I/O: oto najważniejsze funkcje Gemini AI dla Androida

May 15 2024
Od pomocy w odrabianiu prac domowych po wykrywanie oszustw – pierwszego dnia Google I/O 2024 Google wprowadziło nowe funkcje do Gemini AI.
Skocz do
Circle to Search swojej pracy domowej Gemini Nano jest multimodalny na urządzeniu Gemini dla programistów

Najlepszą od lat nową funkcją Google na Androida jest Circle to Search i dlatego zajęła ona centralne miejsce podczas dzisiejszego przemówienia otwierającego Google I/O. Google ogłosiło nowe aktualizacje Gemini, sztucznej inteligencji obsługującej system operacyjny Android. Większość nowych funkcji wydaje się pomocna, choć mogą wydawać się bardziej subtelne, niż się spodziewałeś.

powiązana zawartość

Teraz możesz wysyłać wiadomości do Google Gemini z dowolnego telefonu z Androidem
Telewizory Google TV wreszcie otrzymują aktualizacje, których szukamy

Produkty powiązane

Kupuj wszystkie smartfony Google na Amazon

Google twierdzi, że ujawni więcej informacji na temat Androida w środę, 15 maja , podczas drugiego dnia konferencji programistów. Czekajcie na te ogłoszenia.

powiązana zawartość

Teraz możesz wysyłać wiadomości do Google Gemini z dowolnego telefonu z Androidem
Telewizory Google TV wreszcie otrzymują aktualizacje, których szukamy

Produkty powiązane

Kupuj wszystkie smartfony Google na Amazon
Żadnej wyszukiwarki Google AI, nie muszę się uczyć o „korzyściach z niewolnictwa”
Udział
Napisy na filmie obcojęzycznym
  • Wyłączony
  • język angielski
Udostępnij ten film
Facebook Twitter E-mail
Link do Reddita
Żadnej wyszukiwarki Google AI, nie muszę się uczyć o „korzyściach z niewolnictwa”

Zakreśl kółko, aby przeszukać swoją pracę domową

Pierwsza duża aktualizacja Gemini jest już dostępna poprzez gest Krąg do wyszukiwania. Od dzisiaj możesz używać długiego skrótu, aby wyszukiwać odpowiedzi na różne pytania dotyczące słów z fizyki i matematyki. Po zapytaniu wyszukiwarka Google wyświetli instrukcje krok po kroku. Pamiętaj, że aby ta funkcja działała, musisz wyrazić zgodę na pomoc w rozwiązywaniu problemów matematycznych i tekstowych w menu Laboratorium wyszukiwania.

Google chwali się na swoim blogu , że jest to możliwe dzięki LearnLM, „nowej rodzinie modeli dostosowanych do nauki”. Szczerze mówiąc, moje starsze, milenijne ja jest zazdrosne, że dzieci mają obecnie taką pomoc. Google planuje udostępnić w dalszej części roku więcej pomocy w odrabianiu zadań domowych ze przedmiotów STEM, w tym możliwość identyfikowania wykresów i diagramów.

Bliźnięta zyskują większy kontekst

Przeciągnij i upuść obrazy generatywne pomiędzy Gemini i innymi aplikacjami.

Jeśli zależało Ci na większym kontekście dla Google Gemini, w tym roku będzie go jeszcze więcej. Firma Google ogłosiła na I/O, że w nadchodzącej aktualizacji zadzwonisz do Gemini, aby wejść w interakcję z aplikacją, której używasz. Możesz na przykład przeciągnąć i upuścić obraz wygenerowany przez Gemini do innej aplikacji, takiej jak Wiadomości, lub zagłębić się w film w YouTube bez konieczności opuszczania strony. Abonenci Gemini Advanced będą mieli także możliwość wysłania zapytania do pliku PDF w celu uzyskania szybkiego podsumowania. Ta konkretna aktualizacja zostanie wprowadzona „w ciągu najbliższych kilku miesięcy”.

Gemini Nano działa multimodalnie na urządzeniu

Przykład okna dialogowego, które wyświetli się Gemini, gdy podejrzewa, że ​​trwa oszustwo.

Gemini Nano — najmniejszy model z rodziny Gemini firmy Google i ten, który działa na sprzęcie Pixel — również doczeka się aktualizacji na zgodnych urządzeniach Pixel jeszcze w tym roku. Po pierwsze, Gemini Nano stanie się multimodalne. Sztuczna inteligencja będzie wreszcie mogła jednocześnie przetwarzać wprowadzany tekst i dźwięk lub wideo. Skorzystają na tym funkcje Androida, takie jak TalkBack, w którym Nano może generować opisy obrazów i elementów interfejsu, które nie zawierają szczegółów.

Gemini Nano obsługuje także funkcję wykrywania oszustw w aplikacji Telefon, o której Google poinformował podczas przemówienia. Ta funkcja skanuje rozmowę na urządzeniu, aby w czasie rzeczywistym określić, czy nie doszło do oszustwa. Google twierdzi, że rozmowa jest przetwarzana po stronie sprzętu i nie trafia na serwer. Zamiast tego Nano nasłuchuje słów i zwrotów wyzwalających, a następnie przekazuje informację, że możesz być zamieszany w oszustwo.

Bliźnięta dla programistów

Steve Ballmer, znany z Microsoftu, powiedział to pierwszy: konferencja programistów skupia się wokół programistów, programistów, programistów! Google przypomniał swoim programistom, że Gemini jest dostępne do użytku w Android Studio . Programiści uzyskują wcześniejszy dostęp do Gemini 1.5 Pro, który może pomóc w kodowaniu i kompilacji.