Trzy przewidywania a16z dotyczące AI Agent w 2026 roku: zniknięcie pola wprowadzania tekstu, priorytetowe korzystanie z agentów, wzrost znaczenia agentów głosowych

行业观察2025/12/23 06:06

Pokaż oryginał

Przez:行业观察

a16z przewiduje, że AI ewoluuje z biernego narzędzia do aktywnego agenta.

Autor: Long Yue

Źródło: Wallstreetcn

Podczas niedawno zorganizowanego przez znaną firmę venture capital Andreessen Horowitz (A16z) internetowego seminarium „Big Ideas for 2026”, zespół partnerów przedstawił jasną wizję ewolucji technologii AI: sztuczna inteligencja przekształca się z narzędzia oczekującego na polecenia w „agenta” zdolnego do samodzielnego wykonywania zadań.

Jednocześnie przedstawili trzy „wielkie przypuszczenia” mogące zrewolucjonizować branżę: interakcja z interfejsem użytkownika przesunie się z „podpowiedzi” na „wykonanie”, projektowanie produktów przejdzie z „human-centered” na „agent-first”, a voice agent przejdzie z demonstracji technologicznych do wdrożeń na dużą skalę.

Przypuszczenie pierwsze: zniknięcie pola wejściowego.

Marc Andrusko, partner zespołu inwestycyjnego AI Applications w a16z, odważnie przewiduje: „Do 2026 roku pole wejściowe jako główny interfejs użytkownika aplikacji AI zniknie.” Uważa on, że następna generacja aplikacji AI nie będzie już wymagała od użytkowników żmudnego wpisywania poleceń, lecz będzie obserwować ich zachowania, aktywnie interweniować i przedstawiać propozycje działań do zatwierdzenia.

Za tą zmianą stoi ogromny skok wartości biznesowej AI. Andrusko wskazuje: „Wcześniej skupialiśmy się na globalnych wydatkach na oprogramowanie w wysokości 300–400 miliardów dolarów rocznie, a teraz ekscytuje nas 13 bilionów dolarów wydatków na siłę roboczą tylko w USA. To sprawia, że możliwości rynkowe oprogramowania rosną około 30-krotnie.”

Porównuje przyszłych agentów AI do najlepszych „pracowników klasy S”: „Najbardziej proaktywni pracownicy identyfikują problem, diagnozują jego przyczynę, wdrażają rozwiązanie, a na końcu informują cię: 'Proszę zatwierdzić rozwiązanie, które znalazłem.' To jest przyszłość aplikacji AI.”

Trzy przewidywania a16z dotyczące AI Agent w 2026 roku: zniknięcie pola wprowadzania tekstu, priorytetowe korzystanie z agentów, wzrost znaczenia agentów głosowych image 0

Trzy przewidywania a16z dotyczące AI Agent w 2026 roku: zniknięcie pola wprowadzania tekstu, priorytetowe korzystanie z agentów, wzrost znaczenia agentów głosowych image 1

Przypuszczenie drugie: „Agent-first” i czytelność maszynowa.

Stephanie Zhang, partnerka inwestycyjna w a16z Growth, przedstawiła przełomową logikę projektowania: oprogramowanie nie będzie już projektowane dla ludzkiego oka. Wskazuje: „To, co ważne dla konsumpcji przez ludzi, może nie być już ważne dla konsumpcji przez agentów. Nowym kierunkiem optymalizacji nie jest warstwa wizualna, lecz czytelność maszynowa (Machine Legibility).”

Według Stephanie, zasady „5W1H” czy wyrafinowane UI, które optymalizowaliśmy pod kątem uwagi ludzi, zostaną zrekonstruowane w erze agentów. Przewiduje: „Możemy zobaczyć ogromną ilość hiperpersonalizowanych, wysokoczęstotliwościowych treści generowanych pod kątem zainteresowań agentów – to jak upychanie słów kluczowych w erze agentów.”

Ta zmiana głęboko wpłynie na każdy aspekt – od tworzenia treści po projektowanie oprogramowania.

Trzy przewidywania a16z dotyczące AI Agent w 2026 roku: zniknięcie pola wprowadzania tekstu, priorytetowe korzystanie z agentów, wzrost znaczenia agentów głosowych image 2

Przypuszczenie trzecie: wzrost voice agentów.

Jednocześnie Olivia Moore, partnerka zespołu inwestycyjnego AI Applications w a16z, zauważa: „Voice agent AI zaczynają zdobywać pozycję.” Twierdzi, że voice agent przeszły od koncepcji rodem z science fiction do systemów, które są masowo kupowane i wdrażane przez prawdziwe firmy. Szczególnie w opiece zdrowotnej, finansach i rekrutacji voice agent są cenione za wysoką niezawodność, zgodność z przepisami i zdolność do rozwiązywania problemów z niedoborem siły roboczej.

Podzieliła się ciekawym spostrzeżeniem: „W sektorze bankowym i usług finansowych voice AI faktycznie radzi sobie lepiej, ponieważ ludzie są bardzo dobrzy w łamaniu przepisów, a voice AI zawsze wykonuje je precyzyjnie.”

Moore podkreśla: „AI nie zabierze ci pracy, ale osoba korzystająca z AI już tak.” To zapowiada głęboką transformację tradycyjnych call center i branży BPO, a dostawcy usług wykorzystujący AI, oferujący niższe ceny lub większą przepustowość, zyskają przewagę konkurencyjną.

Trzy przewidywania a16z dotyczące AI Agent w 2026 roku: zniknięcie pola wprowadzania tekstu, priorytetowe korzystanie z agentów, wzrost znaczenia agentów głosowych image 3

Kluczowe punkty tego internetowego seminarium:

Koniec UI: Era prompt box jako głównego interfejsu dobiega końca, AI przechodzi z „biernej reakcji” do „aktywnej obserwacji i interwencji”.
30-krotny wzrost rynku: Rynek docelowy AI przesuwa się z 400 miliardów dolarów wydatków na oprogramowanie do 13 bilionów dolarów wydatków na siłę roboczą, co oznacza fundamentalną zmianę logiki biznesowej.
Model pracownika klasy S: Idealne AI powinno działać jak wysoce proaktywny pracownik: wykrywać problemy, diagnozować przyczyny, proponować i wdrażać rozwiązania, pozostawiając człowiekowi jedynie końcową akceptację.
Czytelność maszynowa (Machine Legibility): Cel projektowania oprogramowania przesuwa się z „human-first” na „agent-first”, a warstwa wizualna UI przestaje być kluczowa.
Alienacja tworzenia treści: Konkurencja marek przesuwa się z przyciągania uwagi ludzi na „Generative Engine Optimization” (GEO), a nawet może pojawić się ogromna ilość „wysokoczęstotliwościowych treści” generowanych pod kątem AI.
Przewaga compliance voice AI: W branżach o wysokim progu wejścia, takich jak finanse, voice AI przewyższa ludzi, ponieważ może w 100% przestrzegać wymogów compliance i zapewniać śledzenie działań.
Wejście w opiekę zdrowotną i administrację: Voice agent rozwiązują problem wysokiej rotacji w służbie zdrowia i mogą w przyszłości rozwiązać problemy z obsługą 911 i DMV (wydziały komunikacji).
Przemysł voice AI: Voice AI rozwija się jako cała branża, a nie pojedynczy rynek – na każdym poziomie łańcucha wartości pojawią się zwycięzcy, od modeli bazowych po aplikacje platformowe.
Od narzędzia do „pracownika AI”: AI nie jest już prostym narzędziem pomocniczym, lecz cyfrowym pracownikiem zdolnym do samodzielnego zamykania pełnych cykli biznesowych.

Pełny zapis seminarium zespołu AI a16z (przetłumaczony przez narzędzie AI):

Reżyser 00:00 Witajcie na „Big Ideas for 2026”. Usłyszymy, jak Marc Andrusko omawia ewolucję interfejsu użytkownika AI oraz fundamentalną zmianę w sposobie interakcji z inteligentnymi systemami. Stephanie Zhang opowie o znaczeniu projektowania dla agentów, a nie ludzi – ta zmiana przekształca rozwój produktów. Olivia Moore podzieli się swoimi spostrzeżeniami na temat wzrostu voice agent AI i ich rosnącej roli w naszym codziennym życiu. To nie są tylko prognozy – to wgląd od osób współpracujących bezpośrednio z założycielami i firmami budującymi przyszłość.

Marc Andrusko 00:31 Nazywam się Marc Andrusko, jestem partnerem w naszym zespole inwestycyjnym AI Applications. Moja wielka wizja na 2026 rok to zniknięcie pola wejściowego jako głównego interfejsu użytkownika aplikacji AI. Następna fala aplikacji będzie wymagać znacznie mniej promptów. Będą obserwować, co robisz, aktywnie interweniować i przedstawiać propozycje działań do twojej akceptacji.

Marc Andrusko 00:49 Szansa, którą atakujemy, to wcześniej globalne wydatki na oprogramowanie rzędu 300–400 miliardów dolarów rocznie. Teraz ekscytuje nas 13 bilionów dolarów wydatków na siłę roboczą tylko w USA. To sprawia, że rynek oprogramowania lub całkowity adresowalny rynek (TAM) rośnie około 30-krotnie. Jeśli wyjdziesz z tego punktu i pomyślisz: dobrze, jeśli wszyscy chcemy, aby to oprogramowanie dla nas pracowało, to idealnie powinno być co najmniej tak dobre jak człowiek, a nawet lepsze, prawda? Lubię więc myśleć: jak działają najlepsi pracownicy? Najlepsi ludzie? Ostatnio często omawiam wykres, który krąży na Twitterze. To piramida pięciu typów pracowników i wyjaśnienie, dlaczego najbardziej proaktywni są najlepsi. Na dole piramidy są ci, którzy wykrywają problem i przychodzą po pomoc, pytając, co robić. To najmniej proaktywni pracownicy.

Ale jeśli dojdziesz do poziomu S – najbardziej proaktywnych pracowników – oni wykrywają problem, prowadzą niezbędne badania, by zdiagnozować przyczynę, analizują różne możliwe rozwiązania, wdrażają jedno z nich, a następnie informują cię na bieżąco lub przychodzą na końcu i mówią: „Proszę zatwierdzić rozwiązanie, które znalazłem.” Uważam, że tak będzie wyglądać przyszłość aplikacji AI. I myślę, że każdy tego chce. Wszyscy do tego dążymy. Jestem przekonany, że jesteśmy już blisko. Uważam, że duże modele językowe (LLM) stają się coraz lepsze, szybsze i tańsze, a w pewnym sensie zachowania użytkowników nadal będą wymagały udziału człowieka na końcu procesu, zwłaszcza w sytuacjach wysokiego ryzyka. Ale uważam, że modele są już w stanie proponować bardzo inteligentne sugestie w twoim imieniu, a ty musisz tylko kliknąć „zatwierdź”.

Marc Andrusko 02:27 Jak wiecie, jestem zafascynowany koncepcją AI-native CRM. To doskonały przykład tego, jak mogą wyglądać te proaktywne aplikacje. W dzisiejszym świecie sprzedawca może otworzyć swoje CRM, przejrzeć wszystkie otwarte szanse, sprawdzić kalendarz na dany dzień i zastanowić się, jakie działania mogą mieć największy wpływ na jego lejek sprzedażowy i skuteczność. W przyszłości CRM twój agent AI lub AI CRM powinien robić to wszystko za ciebie nieustannie – nie tylko identyfikować najbardziej oczywiste szanse w twoim kanale, ale także przeszukiwać twoje e-maile z ostatnich dwóch lat, wyciągać potencjalne leady, które zostały zapomniane. Może powinniśmy wysłać do nich e-mail i przywrócić ich do procesu, prawda? Uważam, że możliwości w zakresie pisania e-maili, organizowania kalendarza, przeglądania starych rozmów są nieograniczone.

Marc Andrusko 03:22 Zwykli użytkownicy nadal będą chcieli mieć ostatnie słowo przy zatwierdzaniu. W niemal 100% przypadków będą chcieli, by człowiek był „w pętli” jako ostateczny decydent. I to jest w porządku.

Marc Andrusko 03:33 Uważam, że to naturalny sposób ewolucji. Wyobrażam sobie świat, w którym zaawansowani użytkownicy poświęcają dużo dodatkowego czasu na trenowanie swoich aplikacji AI, by jak najlepiej poznały ich zachowania i sposób pracy. Te aplikacje będą wykorzystywać większe okna kontekstowe, funkcje pamięci już wbudowane w wiele dużych modeli językowych, dzięki czemu zaawansowani użytkownicy będą mogli naprawdę zaufać aplikacji, że wykona 99,9% lub nawet 100% pracy. Będą dumni z liczby zadań, które mogą wykonać bez potrzeby zatwierdzenia przez człowieka.

Stephanie Zhang 04:09 Cześć, nazywam się Stephanie Zhang, jestem partnerką inwestycyjną w zespole a16z Growth. Moja wielka wizja na 2026 rok to: tworzyć dla agentów, nie dla ludzi. Jedną z rzeczy, która najbardziej ekscytuje mnie w 2026 roku, jest to, że ludzie będą musieli zacząć zmieniać sposób, w jaki tworzą. Obejmuje to wszystko – od tworzenia treści po projektowanie aplikacji. Ludzie zaczynają wchodzić w interakcję z siecią lub aplikacjami za pośrednictwem agentów jako pośredników. To, co ważne dla konsumpcji przez ludzi, nie będzie już tak ważne dla agentów.

Stephanie Zhang 04:41 W liceum chodziłam na zajęcia z dziennikarstwa. Tam nauczyliśmy się, jak ważne jest rozpoczynanie artykułów od 5W i 1H (kto, kiedy, gdzie, co, dlaczego, jak) oraz od wprowadzenia w reportażach. Dlaczego? By przyciągnąć uwagę ludzi – mogą przegapić głębokie, wnikliwe stwierdzenia ukryte na piątej stronie, ale agent tego nie przegapi.

Stephanie Zhang 05:02 Przez lata optymalizowaliśmy pod kątem przewidywalnych zachowań ludzi. Chcesz być jednym z pierwszych wyników w Google? Chcesz być jednym z pierwszych produktów na Amazonie? Ta optymalizacja dotyczy nie tylko sieci, ale i projektowania oprogramowania. Aplikacje są projektowane dla ludzkiego oka i kliknięcia. Projektanci optymalizują pod kątem dobrego UI i intuicyjnych procesów. Jednak wraz ze wzrostem wykorzystania agentów znaczenie projektowania wizualnego dla ogólnego zrozumienia będzie maleć. Kiedyś, gdy dochodziło do awarii, inżynierowie przeglądali dashboardy Grafana, próbując zrozumieć, co się stało. Teraz AI SRE (Site Reliability Engineer) odbiera dane telemetryczne, analizuje je i raportuje hipotezy oraz wnioski bezpośrednio na Slacku, by ludzie mogli je przeczytać.

Kiedyś zespoły sprzedażowe musiały klikać i przeglądać CRM-y jak Salesforce, by zebrać informacje. Teraz agent pobiera te dane i podsumowuje wnioski. Nie projektujemy już dla ludzi, lecz dla agentów. Nowym standardem optymalizacji nie jest warstwa wizualna, lecz czytelność maszynowa. To zmieni sposób, w jaki tworzymy i narzędzia, których używamy. Czego szukają agenci? To pytanie, na które nie znamy odpowiedzi. Wiemy jednak, że agenci czytają cały tekst artykułu lepiej niż ludzie, którzy często czytają tylko kilka pierwszych akapitów. Na rynku jest wiele narzędzi, których różne organizacje używają, by zapewnić, że gdy użytkownik zapyta ChatGPT o najlepszą kartę kredytową czy buty, pojawią się ich produkty. Jest wiele narzędzi SEO (tu: fonetycznie), których ludzie używają, ale wszyscy zadają jedno pytanie: czego chcą agenci AI?

Stephanie Zhang 06:43 Lubię to pytanie o to, kiedy ludzie mogą całkowicie wypaść z obiegu. Widzimy już, że w niektórych przypadkach to się dzieje. Nasza spółka portfelowa Dekagon już samodzielnie odpowiada na pytania wielu swoich klientów. W innych przypadkach, takich jak bezpieczeństwo czy rozwiązywanie incydentów, zwykle widzimy więcej ludzi w pętli – agent AI najpierw próbuje zidentyfikować problem, analizuje i przedstawia ludziom różne scenariusze. To zwykle przypadki o większej odpowiedzialności i złożonej analizie, gdzie ludzie pozostają w pętli. I zanim modele i technologia osiągną bardzo wysoką dokładność, mogą tam pozostać dłużej.

Stephanie Zhang 07:33 Nie wiem, czy agenci będą oglądać Instagram Reels. To naprawdę ciekawe – przynajmniej technicznie rzecz biorąc, optymalizacja pod kątem czytelności maszynowej, wnioskowania i trafności jest bardzo ważna, zwłaszcza w porównaniu z przeszłością, gdy chodziło o przyciąganie uwagi ludzi efektownymi środkami. Widzimy już przypadki ogromnej ilości hiperpersonalizowanych treści – może nie tworzysz bardzo trafnego, wnikliwego artykułu, ale produkujesz mnóstwo niskiej jakości treści, skierowanych do różnych rzeczy, które twoim zdaniem mogą zainteresować agentów. To niemal jak słowa kluczowe ery agentów – koszt tworzenia treści zbliża się do zera, a produkcja masowych treści staje się bardzo łatwa. To potencjalne ryzyko generowania ogromnej ilości treści, by przyciągnąć uwagę agentów.

Olivia Moore 08:48 Nazywam się Olivia Moore, jestem partnerką w naszym zespole inwestycyjnym AI Applications. Moja wielka wizja na 2026 rok to: voice agent AI zaczną zdobywać pozycję. W 2025 roku widzimy, jak voice agent przechodzą od czegoś rodem z science fiction do systemów, które prawdziwe firmy kupują i wdrażają na dużą skalę. Cieszę się, widząc, jak platformy voice agent się rozwijają, działają międzyplatformowo i obsługują pełne zadania, przybliżając nas do wizji prawdziwego pracownika AI. Widzimy, że niemal w każdej branży klienci korporacyjni testują voice agent, jeśli nie wdrażają ich już na dużą skalę.

Olivia Moore 09:25 Opieka zdrowotna to chyba największy przykład. Widzimy voice agent w niemal każdym elemencie stacku opieki zdrowotnej – od telefonów do ubezpieczycieli, aptek, dostawców, po, co może zaskakiwać, rozmowy z pacjentami. Może to być podstawowa funkcja, jak umawianie wizyt czy przypomnienia, ale także bardziej wrażliwe rozmowy, jak telefony pooperacyjne czy pierwsze rozmowy psychiatryczne – wszystko obsługiwane przez voice AI. Szczerze mówiąc, głównym czynnikiem jest tu wysoka rotacja i trudności z rekrutacją w branży medycznej, co sprawia, że voice agent, które mogą niezawodnie wykonywać zadania, są bardzo dobrym rozwiązaniem. Podobnie jest w bankowości i usługach finansowych. Można by pomyśleć, że jest tam zbyt wiele regulacji, by voice AI mogło działać. Okazuje się jednak, że to właśnie tam voice AI radzi sobie lepiej, bo ludzie często łamią przepisy, a voice AI zawsze je wykonuje. Co ważne, można śledzić wyniki voice AI w czasie. Wreszcie, kolejną dziedziną, gdzie voice technology robi przełom, jest rekrutacja – od pracy w handlu detalicznym po stanowiska inżynierskie i konsultingowe. Dzięki voice AI kandydaci mogą przejść rozmowę kwalifikacyjną w dowolnym czasie, a potem trafiają do dalszego procesu rekrutacji prowadzonego przez ludzi.

Olivia Moore 10:46 Wraz z poprawą modeli bazowych w tym roku widzieliśmy ogromne postępy w dokładności i opóźnieniach. W rzeczywistości słyszałam, że niektóre firmy voice agent celowo spowalniają swoje agenty lub dodają szumy tła, by brzmiały bardziej ludzko. Jeśli chodzi o BPO (outsourcing procesów biznesowych) i call center, niektóre z nich przejdą łagodną transformację, inne – w obliczu zagrożenia ze strony AI, zwłaszcza voice AI – mogą stanąć przed gwałtownym upadkiem. Trochę jak się mówi: AI nie zabierze ci pracy, ale osoba korzystająca z AI już tak.

Olivia Moore 11:16 Widzimy, że wielu klientów końcowych nadal chce kupować rozwiązania, a nie technologię, którą muszą wdrożyć sami. Dlatego w najbliższym i średnim okresie nadal będą korzystać z call center lub BPO, ale wybiorą te, które oferują niższe ceny lub większą przepustowość dzięki AI. Co ciekawe, w niektórych regionach ludzcy pracownicy są nadal tańsi niż najlepsze voice AI. Wraz z poprawą modeli koszty mogą spaść, a call center w tych rynkach mogą stanąć przed większym zagrożeniem niż obecnie – to będzie ciekawe do obserwowania.

Olivia Moore 11:50 AI radzi sobie świetnie z rozmowami wielojęzycznymi i silnym akcentem. Często podczas spotkań mogę nie dosłyszeć jakiegoś słowa lub frazy, a potem sprawdzam moje notatki z Granola i są one zapisane perfekcyjnie. To świetny przykład możliwości większości dostawców ASR lub speech-to-text.

Olivia Moore 12:08 Teraz jest kilka przypadków użycia, które chciałabym zobaczyć w przyszłym roku, zwłaszcza związanych z administracją publiczną. Jesteśmy inwestorem Prepared 911 – jeśli można obsłużyć połączenia 911 (oni obsługują te niepilne), to można też obsłużyć telefony do DMV (wydział komunikacji) i inne urzędowe, które są obecnie frustrujące zarówno dla konsumentów, jak i pracowników po drugiej stronie.

Olivia Moore 12:32 Chciałabym też zobaczyć więcej voice AI dla konsumentów. Na razie to głównie B2B, bo oczywiste jest zastąpienie lub wsparcie ludzi na infolinii znacznie tańszym AI. W konsumenckim voice AI ekscytuje mnie kategoria związana ze zdrowiem i wellness. Widzimy już voice companion w domach opieki i placówkach dla seniorów – zarówno jako towarzyszy, jak i narzędzia do śledzenia wskaźników zdrowotnych w czasie. Traktujemy voice AI jako branżę, a nie rynek – to oznacza, że na każdym poziomie stacku technologicznego pojawią się zwycięzcy. Jeśli interesuje cię voice AI lub chcesz założyć firmę w tej branży, polecam sprawdzić te modele. Jest wiele świetnych platform, jak 11 Labs, gdzie możesz przetestować tworzenie własnego głosu i voice agent. Zdobędziesz świetne wyobrażenie o tym, co jest możliwe i co przyniesie przyszłość.

Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.

PoolX: Stakuj, aby zarabiać

Nawet ponad 10% APR. Zarabiaj więcej, stakując więcej.

Stakuj teraz!