YouTube atakowany przez sztuczną inteligencję na wejściach/wyjściach

21

Maksymalizacja tokenów. To słowo klucz.

Dyrektor generalny Google, Sundar Pichai, często używał tego terminu podczas tegorocznej konferencji I/O. Brzmi to absurdalnie, dopóki nie przypomnisz sobie, że przetwarzamy biliardy transakcji na całym świecie. Sprawa jest jednak prosta: Google stawia na sztuczną inteligencję.

To już przejęło Twoje cyfrowe życie. Lub nie, w zależności od używanych aplikacji. Większość dzisiejszych ogłoszeń dotyczyła aktualizacji modelu w suchym języku. Nudne rzeczy. Syntetyczne generatory wideo. Eksperymenty multimodalne.

A potem pojawił się YouTube.

Najczęściej oglądana platforma wideo w historii otrzymała tylko kilka aktualizacji. Prawie bez szumu. Jednak te zmiany mogą zrewolucjonizować sposób, w jaki oglądamy wideo.

Remiks rzeczywistości z Omni

Niedawno wprowadzono Gemini Omni. To jest model globalny. Dwukierunkowa, multimodalna technologia, która twierdzi, że jest w stanie stworzyć „wszystko z dowolnego wyniku”.

Jest teraz zintegrowany z funkcją remiksowania filmów Short w YouTube.

To narzędzie do tworzenia treści. Wykorzystuje istniejące materiały i przekształca je w coś innego. Dzięki połączeniu Omni sugestie AI stają się dokładniejsze. Mocniejszy. Możesz remiksować swoje spodenki, mając większą kontrolę nad procesem.

Istnieje jednak niuans. Filmy będą oznaczone etykietą. Automatycznie. Metadane oznaczają je jako wygenerowane przez sztuczną inteligencję i zawierają linki do źródła. To zasługuje na pochwałę. Przejrzystość ma znaczenie, gdy twarze zaczynają się zniekształcać.

YouTube wdraża także system rozpoznawania podobieństwa dla wszystkich użytkowników powyżej 18 roku życia.

Pomaga autorom znaleźć fragmenty, w których zmieniono ich twarz. Generowane przez algorytmy. System znajduje podróbki.

Zapytaj algorytm

Druga aktualizacja nie dotyczy samego YouTube’a. Przynajmniej nie bezpośrednio.

Jest w pasku wyszukiwania. Google nazywa to funkcją Zapytaj YouTube.

Wyobraź sobie, że zadajesz trudne pytanie. Na przykład, jak nauczyć dziecko jeździć na rowerze. Nie otrzymujesz tylko niebieskich linków. Dostajesz wideo. Wbudowany. Bezpośrednio na stronie wyników.

AI generuje interaktywną reakcję. Spersonalizowane. Bezpośredni. Film szkoleniowy oglądasz bez klikania linków. Google twierdzi, że „całkowicie zmienia” doświadczenie użytkownika. To mocne słowa.

Funkcja jest wciąż w fazie testów. Skalowanie w całych Stanach Zjednoczonych nastąpi latem tego roku.

Więc teraz czekasz.

Siedzimy z boku i pozwalamy modelom gotować wyniki. Maksymalizacja tokena wydaje się wymagać dużo pracy przy bardzo niewielkim zrozumieniu, co się dzieje. Oglądamy wideo. Algorytm decyduje, czego potrzebujemy.

Czy to czyni tę technologię użyteczną?

Prawdopodobnie. Do następnego ostrego zakrętu.