09 stycznia 2024

Gemini – nowość od Google! Czy ma szansę konkurować z OpenAI?

Google żywo interesuje się sztuczną inteligencją, modelami językowymi oraz uczeniem maszynowym, jednak niestety nie można powiedzieć, że PR-owo wychodzą na tym dobrze. Zwłaszcza w przeciągu ostatniego roku. Jednak korporacja nie poddaje się i niedawno szumnie zapowiedziała, że rozpoczyna się era Gemini. W użycie ma wkrótce wejść nowy, jeszcze lepszy model AI, prosto z googlowego laboratorium. Czym jest Gemini i co na to osoby ze świata SEO, które miały już okazję zetknąć się z tą technologią? Czy rzeczywiście jest się czym zachwycać? 

Spis treści:

  1. Gemini – jak przedstawia je Google?
  2. Specjaliści SEO o Gemini – jak wypada „uniwersalny model AI” w oczach użytkowników i ekspertów?
  3. Podsumowanie

Gemini – jak przedstawia je Google?

O istnieniu Gemini dowiedzieliśmy się na początku grudnia ubiegłego roku. Google okrzyknęło go swoim “najzdolniejszym modelem AI” i zaczęło intensywnie go promować. Strona, na której znajdują się informacje o tej technologii jest bardzo dopracowana i pełna materiałów promocyjnych. 

Czym jest Gemini?

Motywem przewodnim w “erze Gemini” jest multimodalność. To właśnie ta cecha ma być głównym atutem nowego modelu AI. Oznacza to, że będzie w stanie pracować z różnymi rodzajami danych, w tym z tekstem, obrazem, wideo, audio oraz kodem. Istotną informacją jest również to, że model będzie występował w 3 rozmiarach: 

  • Gemini Nano – model na urządzenia mobilne,  
  • Gemini Pro – model, który najlepiej radzi sobie z szeroką gamą zadań, 
  • Gemini Ultra – najzdolniejszy i największy model do wysoce skomplikowanych zadań. 

Kto może już korzystać z Gemini? Tak jak można się spodziewać, mieszkańcy Stanów Zjednoczonych. W tym momencie Bard ma już zaimplementowane Gemini Pro, jednak Europejczycy będą musieli nieco poczekać, aż technologia zostanie im udostępniona. W międzyczasie nic nie stoi na przeszkodzie, aby sprawdzić opinie i dowiedzieć się, czy warto wstrzymywać oddech. 

Co potrafi Gemini?

Według tego, co podaje Google, Gemini prześcignął człowieka w teście MMLU (Massive Multitask Language Understanding). Taka próba ma na celu ocenę zdolności AI w zakresie rozumienia języka. Łączy 57 dziedzin nauki, sprawdza wiedzę i zdolność rozwiązywania problemów. W takim teście udało się Gemini osiągnąć wynik o 0,2 lepszy niż ludzkim ekspertom. 

Co więcej, model ten potrafi generować kod, zależnie od tego, co do niego wrzucimy, połączyć tekst i obrazki oraz rozumieć różne typy przekazów wizualnych i poruszać się pomiędzy nimi. Zdolności te w ciekawy sposób demonstruje wideo przygotowane przez Google. Składa się z kilku segmentów, w których Gemini rozwiązuje różnego typu zadania, wymagające łączenia różnych form przyswajania treści i kojarzenia pojęć. 

 

Gemini kontra GPT-4

Google nie kryje się z tym, kogo uważa za swojego największego rywala na polu sztucznej inteligencji. Nic więc dziwnego, że porównuje się z ChatemGPT-4. W teście MMLU, Gemini Ultra wypadł lepiej od konkurenta, czym oczywiście chwali się na stronie. Można też zajrzeć do tabeli, w której znajduje się bardziej szczegółowe porównanie w różnych testach. Można zaobserwować tam, że większość wypadła na korzyść Gemini. 

Gemini bez różowych okularów

Wszystko, co pokazuje nam Google, prezentuje się bardzo ładnie, jednak nie da się ukryć, że korporacja próbuje nam założyć różowe okulary. Pokazuje nam zabawy z Gemini, który rozpoznaje kształty na obrazku i proponuje gry geograficzne w filmiku, który okazuje się być zmontowany z kilku prób nakierowania modelu na właściwe tory. Na Twitterze (X) zorientowano się dość szybko, a Google potwierdziło informację. 

Niektórzy z powątpiewaniem przyglądają się także doskonałym wynikom, jakie Gemini osiągał w porównaniu z ChatemGPT-4. Po pierwsze, do porównania wykorzystano Gemini Ultra, czyli najbardziej wydajny model, co do którego istnieją wątpliwości, czy zostanie kiedykolwiek oddany do użytku publicznie. Po drugie, wykorzystano 2 różne metody testowania, aby porównać, jak oba modele sobie poradzą. Metodę chain-of-thoughts (CoT@32) dla Gemini oraz metodę 5-shots dla ChatuGPT. Ta pierwsza polega na zaprezentowaniu modelowi 32 różnych ścieżek rozumowania dla danego zapytania, a druga na pokazaniu AI 5 przykładów zadań wraz z pytaniami i prawidłowymi odpowiedziami. 

Specjaliści SEO o Gemini – jak wypada „uniwersalny model AI” w oczach użytkowników i ekspertów?

Nie da się ukryć, że chociaż Google pięknie przedstawia swoje najnowsze dziecko, oczami ekspertów sytuacja wygląda nieco inaczej. Z różnych stron zaczynają dochodzić głosy krytyki. Szczególnie społeczność na Twitterze daje znać, że nie jest zadowolona z tego, co Gemini sobą reprezentuje. Im bardziej korporacja starała się rozbudzić entuzjazm, tym gorszy zawód udało im się wywołać. 

Bojan Tunguz, specjalista od uczenia maszynowego: Więc poprosiłem Gemini Pro w Bardzie o aktualności związane z najgorętszymi wiadomościami ostatnich dni, wojną w Izraelu i strefie Gazy, a jego odpowiedzią było “po prostu to wygoogluj.” 

Specjalista od cyberbezpieczeństwa Benjamin Netter: Dla Waszej informacji, Google Gemini to syf. 

Mimo to zdarzają się również osoby, które pozytywnie podchodzą do całego projektu. Mihir Patel: Gemini jest świetne. Znacznie lepsze i znacznie szybsze niż GPT-4. Kupuję to – przerzucam się. 

Reakcje w komentarzach do tego tweeta mówią jednak same za siebie. Użytkownikowi szybko zwrócono uwagę na potknięcia Gemini. 

Podsumowanie 

Pod koniec ubiegłego roku, mieliśmy szansę zapoznać się z Google Gemini, nowym modelem sztucznej inteligencji. Jego największym atutem ma być multimodalność, czyli swobodne poruszanie się między tekstem, obrazem, dźwiękiem, wideo oraz kodem. Możemy spodziewać się go w 3 rozmiarach. Nano na urządzenia mobilne, Pro, które Amerykanie mogą obecnie testować przy pomocy Barda oraz Ultra do wysoce skomplikowanych zadań. 

Google nie pierwszy raz próbuje rywalizować z OpenAI. Tym razem otwarcie wypowiada wojnę ChatowiGPT-4 i w swoich materiałach promujących, porównuje z nim swój nowy twór na każdym kroku. Według przeprowadzonych testów, w tym również MMLU, Gemini Ultra niemal w każdym zadaniu wypada lepiej. 

Mimo tego, że cała kampania wraz z promującymi Gemini wideo robi pozornie pozytywne wrażenie, z różnych stron odzywają się głosy sceptyków. Wątpliwości budzi mocno zedytowany filmik pokazujący możliwości Gemini, a także sposób porównania modelu z ChatemGPT-4, w którym zastosowano dwie różne metody. 

Co więcej, liczni specjaliści testują obecnie Gemini poprzez Barda i wielu z nich nie jest zadowolonych z efektów. Chociaż najnowsze dziecko Google dopiero stawia pierwsze kroki, reakcje wskazują, że nie może niestety liczyć na taryfę ulgową. Pokazuje to, że korporacja nie cieszy się zbytnim zaufaniem w kwestii generatywnej sztucznej inteligencji.

    Przyjmuję do wiadomości, że moje dane osobowe będą przetwarzane w celu udzielenia odpowiedzi na przedstawione pytania/wnioski.
    Dowiedz się więcej na temat ochrony Twojej prywatności
    Udostępnij dalej

    Podobał Ci się artykuł?

    Zobacz naszą ofertę!

    The First

    Pozycjonujemy Po Mistrzowsku

    Dodaj komentarz

    Strona używa ciasteczek. Potwierdź, aby kontynuować. Nasza Polityka Prywatności więcej

    Cookie na tej stronie są ustawione na "zezwalaj na pliki cookie", aby umożliwić Ci najlepszy sposób przeglądania strony.

    Zamknij