problem chowu wsobnego AI: dlaczego nasza cyfrowa przyszłość może stać się głupszy (i bardziej pokręcone)
Najważniejsze w skrócie:
-
Ryzyko "upadku modelu": Największe niebezpieczeństwo "chowu wsobnego AI" - szkolenia modeli AI z wykorzystaniem danych wygenerowanych przez AI, – jest w tzw. "Model Collapse" [1.1], w którym AI traci łączność z oryginalnym rozkładem ludzkich danych, udowodnić "głupsze" i produkuje niezdarny, nudne publikacji.
-
Wzmocnienie uprzedzeń: Chów wsobny prowadzi do pełzania Zniekształcenie rzeczywistościeliminując istniejące wady i Uprzedzenia (Na przykład, w odniesieniu do płci lub rasy) z każdym pokoleniem danych wygenerowanych przez AI wzmocniony i zalały kulturalny "pulę genów" wspólne banał.
-
Rozwiązanie za pomocą nowych, ludzkich danych: Walka z cyfrowym инбридингом pilnie wymaga stały dopływ świeżego, wysokiej jakości treści, stworzonej przez ludzi [2.1]dostarczone zbieranie etycznych danych, nadzorem ze strony człowieka i bardziej sztywne regulacje (na przykład, Prawo UE o sztucznej inteligencji) muszą być uzupełnione.
Wstęp: AI, którego nie spodziewaliśmy się
Pamiętacie film sci-fi, w którym roboty przejmują dominację nad światem? Co, jeśli prawdziwe zagrożenie to nie jest przymusowe powstanie, a powolna, cicha degradacja, mietlica własność entropia? AI wszędzie, generując tekst, sztuki wizualne, muzykę, a nawet kod. Ale co się dzieje, gdy SI uczy się głównie na sobie i żywi się swoimi dziełami w zamkniętej formie cyklu?
I tutaj zaczyna się "chów wsobny AI". To jest dokładnie to, na co wygląda – zagrożenie cykl szkoleń modeli sztucznej inteligencji z wykorzystaniem treści tworzonych za pomocą sztucznej inteligencji. To prowadzi do tego, że cyfrowy "pulę genów" jest coraz mniej, mniej zróżnicowane i, szczerze mówiąc, bardziej głupi. Jest to cyfrowy odpowiednik "fotokopie fotokopie": każda iteracja traci ostrość i szczegółowość, dopóki nie znajdziemy się w niewyraźne, неузнаваемом bałaganie. Chodzi nie tylko o безвкусном tekście lub nudnym sztuce; jest to szczególnie dziwne i problematyczne wpływ na sztucznej inteligencji, создающем treści "nie jest Bezpieczne dla pracy" (NSFW), zakątku świata cyfrowego, gdzie niuansów i oryginalności i bez tego jest bardzo mało.
Szybki rzut oka wstecz: jak to się stało?
Dawno, dawno temu modele sztucznej inteligencji żywili się bogatym i zróżnicowanym treści, tworzonych przez ludzi – książek, artykułów, dzieł sztuki, naukowymi artykułami całej ogromnej i chaotyczna wartością Internetu! To był doskonały cyfrowy "pulę genów", który po prostu gotowana kreatywności i elokwencją.
Następnie poszedł eksplozji kambryjskiej генеративного AI: ChatGPT, DALL-E, Bliźnięta, Claude – niesamowite narzędzia, które zaczęły infesting Internetu własnymi dziełami, syntetyczny przypływ, który miały zwiększony. problem? Podstawowe modele sztucznej inteligencji zawierają już większość łatwo dostępnych wysokiej jakości ludzkich danych "zjedzony". To żarłoczne bestie, które stale głodni. Firmy potrzebują więcej danych do stymulowania wzrostu ich modeli, a "syntetycznych danych, generowanych przez sztuczną inteligencję, jest mnóstwo i są tanie, nawet jeśli zostanie udowodnione, że są one gorszej jakości.
Naukowcy nazywają to zjawisko "Habsburska AI" lub "Model Autography Disorder" (MAD, wzorcowy аутофагическое disorder) [²·²] i przeprowadza paralele z niesławnego królewskiej rodziny Habsburgów, którego nieustanny chów wsobny doprowadził do zwiększenia wad genetycznych – galerii nieudanych portretów personel sprzedaży bezpośredniej, uwierzytelniający ich upadek. Tylko wyobraź sobie, jak wygląda twoje drzewo genealogiczne! To jasne przypomnienie o tym, że różnorodność to nie tylko modne słowo, ono konieczne dla zrównoważonego rozwoju i przetrwania.
Straszna prawda: co się dzieje, gdy SI "инбридингуется"?
Skutki chowu wsobnego AI liczne i alarmujący.
"Upadek modelki": kiedy SI zapomina, jak działa AI Najbardziej dramatyczne jest wynikiem "Model Collapse" (Upadek modelu) [¹·¹], AI-odpowiednik załamania nerwowego. Modele tracą łączność z oryginalnym rozkładem danych, kotwicą rzeczywistości, który utrzymuje je na ziemi. Stają się one mniej skuteczne, mniej wiarygodne i, w końcu, mniej przydatne. Badanie [¹·¹] pokazuje, że tak zwane efekty "upadku modelu" mogą wystąpić, gdy system AI coraz częściej uczą się na podstawie danych generowanych przez AI: informacja staje się bardziej jednorodna, błędy są wzmocnione, a różnorodność językowa maleje.
Fazy rozpadu podstępny. W początkowej fazie upadku AI zaczyna tracić z oczu cienkie, bardziej rzadkie części emisji, niuanse, które sprawiają, że ludzkie wyrażenie taki bogaty. Na pierwszy rzut oka może się to wydawać normalne, ale traci swój blask, zdolność zaskakiwać i zachwycać. W miarę tego, jak upadek przechodzi w swoje późniejszym etapie, jest kompletny chaos. AI miesza podstawowe koncepcje i tworzy powtarzalne, bezsensowne lub po prostu "urojenia" wyniki. Pamiętaj eksperyment, w którym odręcznie liczby generowane przez sztuczną inteligencję, zamieniły się w rozmazane plamy po zaledwie 30 pokoleń uczenia się siebie nawzajem? Tak, to upadek modelki w akcji. wynik? Systemy sztucznej inteligencji stają się coraz bardziej "tępe", dając niezdarny, zrobotyzowane i coraz bardziej nudne wyniki.
Zniekształcenie rzeczywistości (i kultury): Oprócz kompletnego upadku, chów wsobny AI prowadzi do cienkim, ale всепроникающему Zniekształcenie rzeczywistości.
Pomyśl o efekcie "żółtego filtra". Czy zauważyłeś, że obrazy generowane przez sztuczną inteligencję, czasami mają podobny, prawie jednolity "widok"? To nie przypadek. Jest to objaw chowu wsobnego. AI uczy się na interpretacjach innych AI, a nie na świeżym, nie pośrednim percepcji wzrokowej ludzkiej twórczości. To tworzy pętlę sprzężenia zwrotnego, mała echo-przestrzeń, w której oryginalność atrofii i umiera. W rezultacie okazuje się krajobraz kulturowy, coraz bardziej zaludnione powierzchowne symulacjami i wspólne banał. Jeśli AI może wnieść własne uprzedzenia i wady z powrotem w centrum kultury "pulę genów", zniekształcając tym, co tak naprawdę jest ludzkie uczucia. Nasze cyfrowe lustro jest zniekształcony, odzwierciedlając ducha wersji nas samych.
Wzmocnienie uprzedzeń i wad: Być może najbardziej niepokojące jest to, jak chów wsobny AI zniekształca istniejące uprzedzenia wzmocniony. Wszelkie wady występujące w danych źródłowych – a wszystkie dane zawierają wady – będą się nasilać i wzrasta z każdym pokoleniem AI, stażysty na AI. To wygląda na to, jak małe pęknięcie w tamie zamienia się w ogromną szczelinę, która zagraża spowodować lawinę nieprzewidzianych skutków.
NSFW Gau: kiedy "dziwne" zamienia się w "szkodliwe" Wpływ na sztuczna inteligencja "Not Safe For Work" (NSFW)-Inhalte szczególnie alarmujący. Utrata niuansów i oryginalności prowadzi do wyraźnego treści AI, który jest wspólne, powtarzalne i mało oryginalny, po prostu wzmacniając istniejące, często katastrofalne stereotypy. Nastawienie w odniesieniu do płci, rasy lub typu ciała w treści NSFW może być znacznie wzmocniona, co może prowadzić do problematycznych, dyskryminujące lub nawet bezpośrednio szkodliwe koszty. Całkowita degradacja może spowodować anatomicznie poprawne, dziwny lub nieumyślnie nieprawidłowej treści NSFW - pomyśl o "śmiesznie dziwnych" tym przypadku naukowcy, takich jak ręce w nienaturalnych miejscach ciała, skręcone w niemożliwej sytuacji. To zejście w Niesamowitą dolinę, gdzie znajome staje się groteskowe.
To właśnie tutaj etyczne i prawne konsekwencje osiągają apogeum. Czerpać modele mogą jeszcze gorzej pasować do istniejących środków ochrony, co zwiększa ryzyko tworzenia szczerej treści od ludzi bez ich zgody, co może prowadzić do rozprzestrzeniania się неконсенсуальных podróbek. Możliwość nadużyć SI na prześladowania, wymuszenia lub nawet rozszerzenie przestępczości wobec dzieci (CSAM) staje się coraz bardziej poważnym problemem, ciemnym cieniem, скрывающейся na progu tej rewolucji technologicznej. Trwające debaty wokół platform (takich jak Grok) z bardziej miękkim nastawieniem do AI NSFW podkreślają pilną potrzebę trwałych etycznych ramach i skutecznych środkach bezpieczeństwa.
Czy jest jakaś nadzieja? Walka z cyfrowym инбридингом
Przeznaczenie czy nasza przyszłość AI na to, aby być niewyraźne, tendencyjne bałaganem? Nie koniecznie. Ale walka z cyfrowym инбридингом wymaga wielopoziomowego podejścia.
-
wielkie zadanie: znaleźć prawdziwe ludzkie dane Najbardziej pilny problem polega na poszukiwaniu i przetwarzaniu wysokiej jakości, różnorodnych, generowanych ludźmi danych. Problem deficytu jest realne: najlepsze dane coraz trudniej znaleźć i są one coraz droższe wydobywać. Eksperci [²·¹] zgadzam się z tym, że potrzebny jest stały dopływ świeżego treści tworzonych przez ludzi, aby przerwać błędne koło chowu wsobnego. Zasada "śmieci na wejściu, śmieci na wyjściu" jeszcze nigdy nie było tak istotne.
-
Detektyw praca: uznanie wpływu AI Jak możemy określić różnicę między treścią przez człowieka, i treścią, stworzoną sztuczną inteligencją, który został przeszkolony na sobie? Naukowcy badają różne metody, w tym osadzanie niewidzialnych "znaków wodnych" dla identyfikacji treści tworzonych przez sztuczną inteligencję, ale często je łatwo obejść. OpenAI nawet próbowałem użyć "klasyfikator sztucznej inteligencji" do rozpoznawania tekstu, napisanego przez sztuczną inteligencję, ale był zmuszony z niej zrezygnować z powodu niskiej dokładności. Określić, kto jest człowiekiem, a kto bot, okazuje się zaskakująco trudne. Pomiar różnorodności z wykorzystaniem statystycznych wskaźników, takich jak "Entropia" – gdzie wysoka entropia wskazuje na bardziej zróżnicowane i mniej инбредный zestaw danych – oferuje obiecujący sposób.
-
"Lekarstwo": wieloetapowy podejście Rozwiązanie polega na kompleksowej strategii, która nadzoru ze strony człowieka, etyczny zbieranie danych i innowacje technologiczne. Potrzebujemy ludzkie oczy (i mózg!), Aby filtrować wadliwy lub niewłaściwy treści tworzone przez sztuczną inteligencję. Jeśli wrócimy do pozyskiwania ludzkich danych, to musi być zrobione z wyraźnej zgody, szacunku dla prywatności i zaangażowania w różnorodności. Musimy znaleźć sposoby, aby AI mógł się "oduczyć" od złych danych, które zbierał, - proces podobny do cyfrowego detoksykacji. Bardziej rygorystyczne zasady są potrzebne. Rządy i firmy technologiczne powinny współpracować w tworzeniu jasnych wytycznych i obowiązujących przepisów, takich jak Prawo UE o SI, aby uniemożliwić rozprzestrzenianie się инбредного AI. Jedna hybrydowy moderacja, który łączy w sobie automatyzację sztucznej inteligencji (dla szybkości i skali) z ludzkim osądem (dla niuansów i kontekstu), ma kluczowe znaczenie, zwłaszcza w odniesieniu do poufnych treści, takich jak NSFW. wreszcie, Partnerskie relacje między firmami, zajmującymi się sztuczną inteligencją i serwisów agencji, archiwa zdjęć i inne źródła prawdziwego ludzkiego treści są niezbędne dla zapewnienia ciągłego dostarczania świeżych danych.
Mimo problemów, niektórzy eksperci utrzymują ostrożny optymizm, ale uważają, że upadek kompletny model nie jest nieuniknione, jeśli deweloperzy będą uważnie odnosić się do przetwarzania danych i przestrzegania norm etycznych w rozwoju [¹·³].
Podsumowanie: jaka jest stawka dla naszej przyszłości AI?
Stawka jest wysoka. Ryzyko - to przyszłość, w której AI będzie mniej twórcze, mniej dokładne, bardziej stronniczy i mniej reprezentatywny dla samej ludzkości. Przyszłość, w której nasze cyfrowe narzędzia będą stawać się coraz bardziej kruche, zawodne, a nawet szkodliwe.
Ale jest obietnica: jeśli zdecydujemy się problem chowu wsobnego AI w czoło, koncentrując się na różnorodnych, wysokiej jakości danych i etycznym rozwoju, jesteśmy w stanie zagwarantować, że AI będzie potężnym, użytecznym narzędziem, zdolnym głęboko poszerzyć ludzką inteligencję i kreatywność.
To nie jest tylko problem techniczny; jest to problem społeczny. To wymaga czujności, przejrzystości i fundamentalnej zaangażowania na rzecz ochrony naszego cyfrowego "genów" w jednym kawałku. Niech zadbamy o to, aby nasz AI w końcu nie wyglądał jak zacierają fotokopię samego siebie, blada imitacja ludzkiej pomysłowości, której ma służyć. Od tego zależy przyszłość AI i, być może, przyszłość samego ludzkiej kreatywności.
Źródła/Linki
Cześć, nazywam się Julian Weber, Certyfikowany online inżynier i ekspert w генеративному sztucznej inteligencji.
Już od ponad 15 lat jestem głęboko zanurzam się w świat produkcji mediów cyfrowych. Moja podróż rozpoczęła się z fotografii i edycji zdjęć, ale szybko doprowadziła mnie do granic możliwości i dzisiaj to na pewno sztuczna inteligencja. Z 2021 roku specjalizuję się w modelach z dużymi obrazami (LIM).
Nie tylko zapalony użytkownik i тестировщик narzędzi sztucznej inteligencji; ja również aktywnie oświetlania ich wpływ, potencjał i problemy w licznych artykułach na blogu, zwłaszcza w delikatnej dziedzinie генеративного AI dla dorosłych. Więc możesz być pewien, że ja po prostu nie wiem powierzchnię, naprawdę głęboko вникаю w sedno sprawy. Tutaj, w Mainadultportalcheck.com popieram krytyczne oceny tych technologii od stycznia 2024 roku. Moja analiza jest wynikiem praktycznego testowania: ja sam wchodzę w rolę użytkownika, внедряю AI w pracy i dzielę się z wami tym, co naprawdę działa i jakie są ograniczenia.