technologia
Polski startup zachwyca się narzędziem do klonowania głosu „deep fake” – The First News
Polski start-up zachwyca świat technologii „głęboko fałszywym” narzędziem do klonowania głosu, które może imitować „pełen zakres ludzkich emocji” za pomocą dowolnego głosu.
Opracowane przez Piotra Dąbkowskiego, byłego inżyniera systemów uczących się Google i Mati Staniszewskiego, byłego specjalistę ds. strategii wdrożeniowej Palantir, Elevenlabs opracowuje zarówno syntezę mowy, jak i klonowanie głosu, które są w stanie odtworzyć ludzki głos i każdy akcent, „polegając na wysokiej kompresji”. i zrozumienie kontekstu, aby uczynić ludzki język niezwykle realistycznym”.
Mając nadzieję, że jego narzędzia naśladowcze przejmą synchronizację kin i audiobooków i w ten sposób przekształcą swój startup w spółkę wartą miliard dolarów, czeska firma venture capital Credo ogłosiła w zeszłym miesiącu, że zebrała rundę przed-zalążkową o wartości 2 milionów dolarów kierować do firmy.
Startup zyskał rozgłos we wrześniu ubiegłego roku, kiedy zamieścił na YouTube krótki film przedstawiający Leonardo DiCaprio przemawiającego na scenie podczas Szczytu Klimatycznego ONZ.
Po pierwszych czterech sekundach zaczyna mówić głosem znanych osób, takich jak Joe Rogan, Steve Jobs, Robert Downey Jr., Bill Gates i Kim Kardashian, doskonale naśladując ich wzorce mowy, ton i emocje.
Technologia ta nie jest jednak pozbawiona kontrowersji.
Wysoka jakość sklonowanych głosów i pozorna łatwość, z jaką zostały opracowane, sprawiły, że wiele osób obawia się potencjalnego zagrożenia związanego z fałszywymi klipami audio.
Niedawno trolle internetowe z anonimowej witryny z obrazami 4chan wykorzystały ElevenLabs do stworzenia fałszywych głosów Emmy Watson, Joe Rogana i innych osób, które wypowiadały treści rasistowskie, transfobiczne i brutalne.
W przesłanych filmach słychać generowany komputerowo głos, który brzmi, jakby Emma Watson czytała tekst z „Mein Kampf”.
W innym przypadku osoba, której ton jest uderzająco podobny do tonu Bena Shapiro, atakuje Alexandrię Ocasio-Cortez z powodów rasistowskich.
Firma analizuje obecnie dodatkowe środki ochronne dotyczące swojej technologii. Obejmuje to ręczne przeglądanie każdego żądania klonowania głosu lub żądanie informacji o płatności lub „pełnej identyfikacji identyfikacyjnej” przed rozpoczęciem procesu klonowania.
Tymczasem krótkoterminowym celem startupu jest, aby jego usługi działały we wszystkich językach.
Firma chce, aby w przyszłości całą transmisję dźwięku obsługiwali nie aktorzy czy aktorzy głosowi, ale inteligentne boty.
Firma chce także opracować narzędzia do syntezy mowy, które błyskawicznie konwertują mowę na dowolny język.
„Certyfikowany guru kulinarny. Internetowy maniak. Miłośnik bekonu. Miłośnik telewizji. Zapalony pisarz. Gracz.”