09 stycznia 2024
Google żywo interesuje się sztuczną inteligencją, modelami językowymi oraz uczeniem maszynowym, jednak niestety nie można powiedzieć, że PR-owo wychodzą na tym dobrze. Zwłaszcza w przeciągu ostatniego roku. Jednak korporacja nie poddaje się i niedawno szumnie zapowiedziała, że rozpoczyna się era Gemini. W użycie ma wkrótce wejść nowy, jeszcze lepszy model AI, prosto z googlowego laboratorium. Czym jest Gemini i co na to osoby ze świata SEO, które miały już okazję zetknąć się z tą technologią? Czy rzeczywiście jest się czym zachwycać?
Spis treści:
O istnieniu Gemini dowiedzieliśmy się na początku grudnia ubiegłego roku. Google okrzyknęło go swoim “najzdolniejszym modelem AI” i zaczęło intensywnie go promować. Strona, na której znajdują się informacje o tej technologii jest bardzo dopracowana i pełna materiałów promocyjnych.
Motywem przewodnim w “erze Gemini” jest multimodalność. To właśnie ta cecha ma być głównym atutem nowego modelu AI. Oznacza to, że będzie w stanie pracować z różnymi rodzajami danych, w tym z tekstem, obrazem, wideo, audio oraz kodem. Istotną informacją jest również to, że model będzie występował w 3 rozmiarach:
Kto może już korzystać z Gemini? Tak jak można się spodziewać, mieszkańcy Stanów Zjednoczonych. W tym momencie Bard ma już zaimplementowane Gemini Pro, jednak Europejczycy będą musieli nieco poczekać, aż technologia zostanie im udostępniona. W międzyczasie nic nie stoi na przeszkodzie, aby sprawdzić opinie i dowiedzieć się, czy warto wstrzymywać oddech.
Według tego, co podaje Google, Gemini prześcignął człowieka w teście MMLU (Massive Multitask Language Understanding). Taka próba ma na celu ocenę zdolności AI w zakresie rozumienia języka. Łączy 57 dziedzin nauki, sprawdza wiedzę i zdolność rozwiązywania problemów. W takim teście udało się Gemini osiągnąć wynik o 0,2 lepszy niż ludzkim ekspertom.
Co więcej, model ten potrafi generować kod, zależnie od tego, co do niego wrzucimy, połączyć tekst i obrazki oraz rozumieć różne typy przekazów wizualnych i poruszać się pomiędzy nimi. Zdolności te w ciekawy sposób demonstruje wideo przygotowane przez Google. Składa się z kilku segmentów, w których Gemini rozwiązuje różnego typu zadania, wymagające łączenia różnych form przyswajania treści i kojarzenia pojęć.
Google nie kryje się z tym, kogo uważa za swojego największego rywala na polu sztucznej inteligencji. Nic więc dziwnego, że porównuje się z ChatemGPT-4. W teście MMLU, Gemini Ultra wypadł lepiej od konkurenta, czym oczywiście chwali się na stronie. Można też zajrzeć do tabeli, w której znajduje się bardziej szczegółowe porównanie w różnych testach. Można zaobserwować tam, że większość wypadła na korzyść Gemini.
Wszystko, co pokazuje nam Google, prezentuje się bardzo ładnie, jednak nie da się ukryć, że korporacja próbuje nam założyć różowe okulary. Pokazuje nam zabawy z Gemini, który rozpoznaje kształty na obrazku i proponuje gry geograficzne w filmiku, który okazuje się być zmontowany z kilku prób nakierowania modelu na właściwe tory. Na Twitterze (X) zorientowano się dość szybko, a Google potwierdziło informację.
Niektórzy z powątpiewaniem przyglądają się także doskonałym wynikom, jakie Gemini osiągał w porównaniu z ChatemGPT-4. Po pierwsze, do porównania wykorzystano Gemini Ultra, czyli najbardziej wydajny model, co do którego istnieją wątpliwości, czy zostanie kiedykolwiek oddany do użytku publicznie. Po drugie, wykorzystano 2 różne metody testowania, aby porównać, jak oba modele sobie poradzą. Metodę chain-of-thoughts (CoT@32) dla Gemini oraz metodę 5-shots dla ChatuGPT. Ta pierwsza polega na zaprezentowaniu modelowi 32 różnych ścieżek rozumowania dla danego zapytania, a druga na pokazaniu AI 5 przykładów zadań wraz z pytaniami i prawidłowymi odpowiedziami.
Nie da się ukryć, że chociaż Google pięknie przedstawia swoje najnowsze dziecko, oczami ekspertów sytuacja wygląda nieco inaczej. Z różnych stron zaczynają dochodzić głosy krytyki. Szczególnie społeczność na Twitterze daje znać, że nie jest zadowolona z tego, co Gemini sobą reprezentuje. Im bardziej korporacja starała się rozbudzić entuzjazm, tym gorszy zawód udało im się wywołać.
Bojan Tunguz, specjalista od uczenia maszynowego: Więc poprosiłem Gemini Pro w Bardzie o aktualności związane z najgorętszymi wiadomościami ostatnich dni, wojną w Izraelu i strefie Gazy, a jego odpowiedzią było “po prostu to wygoogluj.”
Specjalista od cyberbezpieczeństwa Benjamin Netter: Dla Waszej informacji, Google Gemini to syf.
Mimo to zdarzają się również osoby, które pozytywnie podchodzą do całego projektu. Mihir Patel: Gemini jest świetne. Znacznie lepsze i znacznie szybsze niż GPT-4. Kupuję to – przerzucam się.
Reakcje w komentarzach do tego tweeta mówią jednak same za siebie. Użytkownikowi szybko zwrócono uwagę na potknięcia Gemini.
Pod koniec ubiegłego roku, mieliśmy szansę zapoznać się z Google Gemini, nowym modelem sztucznej inteligencji. Jego największym atutem ma być multimodalność, czyli swobodne poruszanie się między tekstem, obrazem, dźwiękiem, wideo oraz kodem. Możemy spodziewać się go w 3 rozmiarach. Nano na urządzenia mobilne, Pro, które Amerykanie mogą obecnie testować przy pomocy Barda oraz Ultra do wysoce skomplikowanych zadań.
Google nie pierwszy raz próbuje rywalizować z OpenAI. Tym razem otwarcie wypowiada wojnę ChatowiGPT-4 i w swoich materiałach promujących, porównuje z nim swój nowy twór na każdym kroku. Według przeprowadzonych testów, w tym również MMLU, Gemini Ultra niemal w każdym zadaniu wypada lepiej.
Mimo tego, że cała kampania wraz z promującymi Gemini wideo robi pozornie pozytywne wrażenie, z różnych stron odzywają się głosy sceptyków. Wątpliwości budzi mocno zedytowany filmik pokazujący możliwości Gemini, a także sposób porównania modelu z ChatemGPT-4, w którym zastosowano dwie różne metody.
Co więcej, liczni specjaliści testują obecnie Gemini poprzez Barda i wielu z nich nie jest zadowolonych z efektów. Chociaż najnowsze dziecko Google dopiero stawia pierwsze kroki, reakcje wskazują, że nie może niestety liczyć na taryfę ulgową. Pokazuje to, że korporacja nie cieszy się zbytnim zaufaniem w kwestii generatywnej sztucznej inteligencji.
Strona używa ciasteczek. Potwierdź, aby kontynuować. Nasza Polityka Prywatności więcej
Cookie na tej stronie są ustawione na "zezwalaj na pliki cookie", aby umożliwić Ci najlepszy sposób przeglądania strony.