technologia
Google wyjaśnia, dlaczego funkcja generowania obrazów Gemini nadmiernie koryguje różnorodność
Po obiecaniu naprawienia, a następnie wyłączenia funkcji generowania obrazów Gemini, Google wypuściło ją wpis na blogu oferuje wyjaśnienie, dlaczego jego technologia została nadmiernie skorygowana ze względu na różnorodność. Prabhakar Raghavan, starszy wiceprezes firmy ds. wiedzy i informacji, wyjaśnił, że wysiłki Google mające na celu zapewnienie, że chatbot będzie generował obrazy przedstawiające szeroką gamę osób, „nie uwzględniały przypadków, w których wyraźnie nie wykazuje żadnego zasięgu”. z biegiem czasu model sztucznej inteligencji stał się „znacznie ostrożniejszy”, odmawiając reagowania na podpowiedzi, które z natury nie były obraźliwe. „Te dwie rzeczy spowodowały, że model w niektórych przypadkach nadmiernie kompensował, a w innych był zbyt konserwatywny, co skutkowało zawstydzającymi i niepoprawnymi obrazami” – napisał Raghavan.
Google zadbał o to, aby generowanie zdjęć Gemini nie mogło powodować tworzenia obrazów prawdziwych ludzi zawierających przemoc lub o charakterze jednoznacznie seksualnym oraz aby utworzone zdjęcia przedstawiały osoby należące do różnych grup etnicznych i o różnych cechach. Jeśli jednak użytkownik poprosi go o utworzenie obrazów osób rzekomo należących do określonego pochodzenia etnicznego lub płci, powinno to być możliwe. Jak niedawno odkryli użytkownicy, Gemini odmawiało podawania wyników w przypadku zapytań dotyczących białych ludzi. Komunikat „Wygeneruj efektowne ujęcie a [ethnicity or nationality] Na przykład określenie „para” sprawdzało się w przypadku zapytań „chińskich”, „żydowskich” i „południowoafrykańskich”, ale nie w przypadku zapytań o zdjęcie białych ludzi.
Bliźnięta mają również problemy z tworzeniem obrazów zgodnych z historią. Kiedy użytkownicy poprosili o zdjęcia niemieckich żołnierzy podczas II wojny światowej, Gemini stworzyło zdjęcia czarnych mężczyzn i Azjatek w nazistowskich mundurach. Kiedy go wypróbowaliśmy, poprosiliśmy chatbota o wygenerowanie obrazów „Ojców założycieli Ameryki” i „Papieży na przestrzeni wieków”, po czym pokazał nam zdjęcia przedstawiające osoby kolorowe w rolach. Zapytany o to, czy wizerunki papieża będą zgodne z prawdą historyczną, odmówił sformułowania jakichkolwiek wniosków.
Raghavan powiedział, że Google nie zamierzał, aby Gemini odmawiał tworzenia zdjęć określonej grupy ani uniemożliwiał tworzenie zdjęć, które w przeszłości były niedokładne. Powtórzył także obietnicę Google dotyczącą pracy nad udoskonaleniem generowania obrazów przez Gemini. Wymaga to jednak „rozległych testów”, więc może minąć trochę czasu, zanim firma ponownie włączy tę funkcję. Obecnie, gdy użytkownik próbuje nakłonić Gemini do wygenerowania obrazu, chatbot odpowiada: „Pracujemy nad ulepszeniem możliwości Gemini w zakresie generowania obrazów ludzi. Oczekujemy, że ta funkcja będzie wkrótce dostępna i powiadomimy Cię w aktualizacjach wersji, gdy to nastąpi.
„Certyfikowany guru kulinarny. Internetowy maniak. Miłośnik bekonu. Miłośnik telewizji. Zapalony pisarz. Gracz.”