Ba dự đoán lớn về AI Agent năm 2026 của a16z: Sự biến mất của ô nhập liệu, ưu tiên sử dụng agent, sự trỗi dậy của agent thoại
a16z dự đoán rằng AI đang tiến hóa từ công cụ thụ động thành đại lý chủ động.
Tác giả: Long Việt
Nguồn: Wallstreet Insights
Tại hội thảo trực tuyến "Big Ideas for 2026" do Andreessen Horowitz (A16z) - một quỹ đầu tư mạo hiểm nổi tiếng - tổ chức gần đây, đội ngũ đối tác của họ đã vẽ ra một lộ trình tiến hóa rõ ràng của công nghệ AI: Trí tuệ nhân tạo đang chuyển mình từ một công cụ trò chuyện chờ lệnh, thành một "Agent" có khả năng chủ động thực hiện nhiệm vụ.
Đồng thời, họ đưa ra "ba dự đoán lớn" có thể tái định hình ngành công nghiệp: Giao diện người dùng sẽ chuyển từ "nhắc nhở" sang "thực thi", thiết kế sản phẩm sẽ chuyển từ "lấy con người làm trung tâm" sang "ưu tiên Agent", và các Agent giọng nói sẽ chuyển từ trình diễn công nghệ sang triển khai quy mô lớn.
Dự đoán 1: Sự biến mất của ô nhập liệu.
Marc Andrusko, đối tác của nhóm đầu tư ứng dụng AI tại a16z, mạnh dạn dự đoán: "Đến năm 2026, ô nhập liệu - giao diện người dùng chính của các ứng dụng AI - sẽ biến mất." Ông cho rằng, thế hệ ứng dụng AI tiếp theo sẽ không còn yêu cầu người dùng nhập lệnh phức tạp, mà sẽ chủ động quan sát hành vi người dùng, can thiệp và đưa ra các phương án hành động chờ phê duyệt.
Đằng sau sự thay đổi này là bước nhảy vọt về giá trị thương mại của AI. Andrusko chỉ ra: "Trước đây chúng ta quan tâm đến chi tiêu phần mềm toàn cầu hàng năm khoảng 300-400 tỷ USD, còn bây giờ điều khiến chúng tôi phấn khích là chi tiêu lao động 13 nghìn tỷ USD chỉ riêng tại Mỹ. Điều này khiến cơ hội thị trường phần mềm tăng lên khoảng 30 lần."
Ông ví các Agent AI trong tương lai giống như những "nhân viên hạng S" xuất sắc nhất: "Những nhân viên chủ động nhất sẽ nhận diện vấn đề, chẩn đoán nguyên nhân gốc rễ, thực hiện giải pháp và cuối cùng mới báo cho bạn: 'Hãy phê duyệt phương án tôi đã tìm ra.' Đó chính là tương lai của ứng dụng AI."


Dự đoán 2: "Ưu tiên sử dụng Agent" và khả năng đọc máy.
Stephanie Zhang, đối tác đầu tư tăng trưởng của a16z, đã đưa ra một logic thiết kế mang tính đột phá: phần mềm sẽ không còn được thiết kế cho mắt người. Cô chỉ ra: "Những điều quan trọng đối với người tiêu dùng là con người, có thể không còn quan trọng đối với Agent. Hướng tối ưu mới không phải là phân cấp thị giác, mà là khả năng đọc máy (Machine Legibility)."
Theo Stephanie, các nguyên tắc "5W1H" hay giao diện UI tinh xảo mà chúng ta từng tối ưu để thu hút sự chú ý của con người, sẽ bị tái cấu trúc trong kỷ nguyên Agent. Cô dự đoán: "Chúng ta có thể sẽ chứng kiến lượng lớn nội dung siêu cá nhân hóa, tần suất cao được tạo ra cho Agent, giống như việc nhồi nhét từ khóa trong thời đại Agent."
Sự chuyển đổi này sẽ ảnh hưởng sâu sắc đến mọi khía cạnh từ sáng tạo nội dung đến thiết kế phần mềm.

Dự đoán 3: Sự trỗi dậy của Agent giọng nói.
Đồng thời, Olivia Moore - đối tác nhóm đầu tư ứng dụng AI của a16z - nhận thấy: "Agent AI giọng nói đang bắt đầu chiếm lĩnh vị trí nhất định." Cô cho biết, Agent giọng nói đã chuyển từ khái niệm viễn tưởng thành hệ thống thực tế được các doanh nghiệp mua sắm và triển khai quy mô lớn. Đặc biệt trong các lĩnh vực chăm sóc sức khỏe, tài chính ngân hàng và tuyển dụng, Agent giọng nói được ưa chuộng nhờ độ tin cậy cao, tuân thủ tốt và khả năng giải quyết vấn đề thiếu hụt nhân lực.
Cô chia sẻ một phát hiện thú vị: "Trong lĩnh vực ngân hàng và dịch vụ tài chính, AI giọng nói thực tế còn thể hiện tốt hơn, vì con người rất giỏi vi phạm quy định, còn AI giọng nói thì luôn thực hiện chính xác."
Moore nhấn mạnh: "AI sẽ không lấy mất việc của bạn, nhưng một người sử dụng AI thì có thể." Điều này báo hiệu ngành trung tâm cuộc gọi truyền thống và BPO sẽ đối mặt với biến chuyển sâu sắc, và các nhà cung cấp dịch vụ biết tận dụng AI để cung cấp giá rẻ hơn hoặc xử lý khối lượng lớn hơn sẽ có lợi thế cạnh tranh.

Những điểm chính của hội thảo trực tuyến lần này:
- Kết thúc UI: Kỷ nguyên của Prompt Box như giao diện tương tác chính sắp kết thúc, AI sẽ chuyển từ "phản hồi thụ động" sang "quan sát và can thiệp chủ động".
- Tăng trưởng thị trường gấp 30 lần: Thị trường mục tiêu của AI đang chuyển từ chi tiêu phần mềm 400 tỷ USD sang chi tiêu lao động 13 nghìn tỷ USD, logic kinh doanh thay đổi căn bản.
- Mô hình nhân viên hạng S: AI lý tưởng nên giống như nhân viên chủ động: phát hiện vấn đề, chẩn đoán nguyên nhân, đề xuất giải pháp và thực thi, chỉ để con người xác nhận ở bước cuối cùng.
- Khả năng đọc máy (Machine Legibility): Mục tiêu thiết kế phần mềm chuyển từ "ưu tiên con người" sang "ưu tiên Agent", UI phân cấp thị giác sẽ không còn là cốt lõi.
- Sự dị hóa của sáng tạo nội dung: Cạnh tranh thương hiệu sẽ chuyển từ thu hút sự chú ý của con người sang "tối ưu hóa công cụ tạo nội dung" (GEO), thậm chí có thể xuất hiện lượng lớn "nội dung tần suất cao" dành riêng cho AI thu thập.
- Lợi thế tuân thủ của AI giọng nói: Trong các ngành có rào cản cao như tài chính, AI giọng nói vượt trội hơn con người vì có thể tuân thủ 100% quy định và dễ dàng truy vết.
- Thâm nhập vào y tế và chính phủ: Agent giọng nói đang giải quyết vấn đề tỷ lệ nghỉ việc cao trong ngành y tế, và có tiềm năng giải quyết các điểm đau trong dịch vụ công như 911 và DMV (cục quản lý phương tiện).
- Công nghiệp hóa AI giọng nói: AI giọng nói đang phát triển thành một ngành công nghiệp hoàn chỉnh chứ không chỉ là một thị trường đơn lẻ, mỗi tầng trong chuỗi giá trị đều có cơ hội lớn, từ mô hình nền tảng đến ứng dụng cấp nền tảng.
- Từ công cụ đến "nhân viên AI": AI không còn là công cụ hỗ trợ đơn giản, mà là nhân viên số có thể xử lý trọn vẹn quy trình nghiệp vụ độc lập.
Toàn văn hội thảo nhóm AI a16z (dịch bởi công cụ AI):
Đạo diễn 00:00 Chào mừng đến với "Big Ideas for 2026". Chúng ta sẽ nghe Marc Andrusko thảo luận về sự tiến hóa của giao diện người dùng AI và sự thay đổi căn bản trong cách chúng ta tương tác với hệ thống thông minh. Stephanie Zhang sẽ bàn về ý nghĩa của việc thiết kế cho Agent thay vì cho con người, sự chuyển đổi này đang tái định hình phát triển sản phẩm. Olivia Moore sẽ chia sẻ quan điểm về sự trỗi dậy của Agent AI giọng nói và vai trò ngày càng tăng của nó trong cuộc sống hàng ngày. Đây không chỉ là dự đoán, mà là những góc nhìn từ những người đang hợp tác trực tiếp với các nhà sáng lập và công ty xây dựng thế giới tương lai.
Marc Andrusko 00:31 Tôi là Marc Andrusko, đối tác nhóm đầu tư ứng dụng AI của chúng tôi. Ý tưởng lớn của tôi cho năm 2026 là sự biến mất của ô nhập liệu như giao diện người dùng chính của ứng dụng AI. Làn sóng ứng dụng tiếp theo sẽ cần ít nhắc nhở hơn nhiều. Chúng sẽ quan sát bạn đang làm gì và chủ động can thiệp, đưa ra phương án hành động để bạn xem xét.
Marc Andrusko 00:49 Cơ hội mà chúng tôi đang nhắm tới trước đây là chi tiêu phần mềm toàn cầu hàng năm khoảng 300-400 tỷ USD. Bây giờ điều khiến chúng tôi phấn khích là chi tiêu lao động 13 nghìn tỷ USD chỉ riêng tại Mỹ. Điều này khiến cơ hội thị trường phần mềm hoặc tổng thị trường tiềm năng (TAM) tăng lên khoảng 30 lần. Nếu bạn xuất phát từ đây, rồi nghĩ, được rồi, nếu tất cả chúng ta đều muốn phần mềm này làm việc cho mình, lý tưởng nhất là khả năng làm việc của nó ít nhất phải ngang bằng con người, thậm chí còn tốt hơn, đúng không? Vì vậy tôi thích suy nghĩ, ừm, nhân viên xuất sắc nhất làm như thế nào? Nhân viên con người xuất sắc nhất làm như thế nào? Gần đây tôi thường bàn về một biểu đồ lan truyền trên Twitter. Đó là một kim tự tháp về năm loại nhân viên, và lý do tại sao những nhân viên chủ động nhất lại là tốt nhất. Nếu bạn bắt đầu từ đáy kim tự tháp, những người ở đó là phát hiện một vấn đề rồi tìm đến bạn xin giúp đỡ, hỏi nên làm gì. Đó là nhân viên có mức chủ động thấp nhất.
Nhưng nếu bạn lên đến hạng S, tức là nhân viên chủ động nhất mà bạn có thể có, họ sẽ phát hiện một vấn đề, nghiên cứu cần thiết để chẩn đoán nguồn gốc vấn đề, nghiên cứu nhiều giải pháp khả thi, thực hiện một trong số đó, rồi cho bạn biết tình hình bất cứ lúc nào, hoặc đến phút cuối mới nói: "Hãy phê duyệt giải pháp tôi đã tìm ra." Tôi nghĩ đó chính là hình mẫu ứng dụng AI tương lai. Và tôi nghĩ đó là điều mọi người đều mong muốn. Đó là hướng mà tất cả chúng ta đang nỗ lực. Vì vậy tôi rất tự tin rằng chúng ta gần như đã đạt được điều đó. Tôi nghĩ các mô hình ngôn ngữ lớn (LLM) ngày càng tốt hơn, nhanh hơn, rẻ hơn, và tôi nghĩ ở một mức độ nào đó, hành vi người dùng vẫn cần có sự tham gia của con người ở bước cuối để phê duyệt, đặc biệt trong các tình huống rủi ro cao. Nhưng tôi nghĩ mô hình hoàn toàn có khả năng đưa ra các đề xuất rất thông minh thay mặt bạn, và bạn chỉ cần nhấn xác nhận.
Marc Andrusko 02:27 Như các bạn biết, tôi rất say mê khái niệm CRM AI gốc. Tôi nghĩ đây là ví dụ hoàn hảo cho thấy các ứng dụng chủ động này có thể trông như thế nào. Trong thế giới hiện tại, một nhân viên bán hàng có thể mở CRM của họ, xem tất cả các cơ hội đang mở, kiểm tra lịch trình trong ngày, rồi nghĩ, được rồi, bây giờ tôi có thể làm gì để tác động lớn nhất đến phễu bán hàng và khả năng chốt đơn của mình. Còn với CRM tương lai, Agent AI hoặc AI CRM của bạn nên liên tục làm tất cả những việc đó cho bạn, không chỉ nhận diện các cơ hội rõ ràng nhất trong kênh, mà còn lục lại email hai năm trước, phát hiện ra, bạn biết đấy, đây từng là một đầu mối tiềm năng nhưng bạn đã để nó nguội lạnh. Có lẽ chúng ta nên gửi email này để kéo họ trở lại quy trình của bạn, đúng không? Vì vậy tôi nghĩ, trong việc soạn email, sắp xếp lịch, xem lại các cuộc gọi cũ, cơ hội là vô tận.
Marc Andrusko 03:22 Người dùng phổ thông vẫn sẽ muốn phê duyệt ở bước cuối cùng. Gần như 100% trường hợp, họ sẽ muốn phần con người "trong vòng lặp" là người quyết định cuối cùng. Điều đó rất tốt.
Marc Andrusko 03:33 Tôi nghĩ đó là cách nó tiến hóa tự nhiên. Tôi có thể hình dung một thế giới nơi người dùng cao cấp (power user) sẽ bỏ ra rất nhiều công sức bổ sung để huấn luyện bất kỳ ứng dụng AI nào họ sử dụng, để nó hiểu càng nhiều càng tốt về hành vi và cách làm việc của họ. Những ứng dụng này sẽ tận dụng cửa sổ ngữ cảnh lớn hơn, tận dụng chức năng ghi nhớ đã được tích hợp vào nhiều mô hình ngôn ngữ lớn, giúp người dùng cao cấp thực sự tin tưởng ứng dụng hoàn thành 99,9% thậm chí 100% công việc. Họ sẽ tự hào về số lượng nhiệm vụ có thể hoàn thành mà không cần con người phê duyệt.
Stephanie Zhang 04:09 Chào, tôi là Stephanie Zhang, đối tác đầu tư nhóm tăng trưởng của a16z. Ý tưởng lớn của tôi cho năm 2026 là: sáng tạo cho Agent, không phải cho con người. Một điều khiến tôi rất hào hứng về năm 2026 là mọi người phải bắt đầu thay đổi cách họ sáng tạo. Điều này bao trùm mọi khía cạnh từ sáng tạo nội dung đến thiết kế ứng dụng. Mọi người bắt đầu tương tác với các hệ thống như web hoặc ứng dụng thông qua Agent làm trung gian. Những điều quan trọng đối với người tiêu dùng là con người, sẽ không còn quan trọng như vậy với Agent.
Stephanie Zhang 04:41 Khi tôi học trung học, tôi từng học lớp báo chí. Trong lớp báo chí, chúng tôi học về tầm quan trọng của việc mở đầu bài báo bằng 5W và 1H (ai, khi nào, ở đâu, cái gì, tại sao, như thế nào), cũng như mở đầu phóng sự bằng một đoạn dẫn. Tại sao? Để thu hút sự chú ý của con người, vì con người có thể bỏ lỡ những phát biểu sâu sắc, có giá trị nằm sâu trong trang H5, nhưng Agent thì không.
Stephanie Zhang 05:02 Nhiều năm qua, chúng ta tối ưu cho hành vi có thể dự đoán của con người. Bạn muốn nằm trong những kết quả tìm kiếm đầu tiên của Google? Bạn muốn là một trong những sản phẩm đầu tiên được liệt kê trên Amazon. Loại tối ưu hóa này không chỉ áp dụng cho web mà còn cho thiết kế phần mềm. Ứng dụng được thiết kế cho mắt và cú nhấp chuột của con người. Nhà thiết kế tối ưu cho UI tốt và quy trình trực quan. Nhưng khi Agent được sử dụng nhiều hơn, thiết kế thị giác sẽ giảm tầm quan trọng đối với sự hiểu tổng thể. Trước đây, khi có sự cố, kỹ sư sẽ vào bảng điều khiển Grafana, cố gắng ghép nối xem chuyện gì đã xảy ra. Bây giờ, AI SRE (kỹ sư độ tin cậy trang web) sẽ nhận dữ liệu telemetry. Chúng sẽ phân tích dữ liệu đó và báo cáo giả thuyết, nhận định trực tiếp trên Slack cho con người đọc.
Trước đây, đội bán hàng phải nhấp và duyệt qua CRM như Salesforce để thu thập thông tin. Bây giờ, Agent sẽ lấy dữ liệu đó và tóm tắt nhận định cho họ. Chúng ta không còn thiết kế cho con người mà là cho Agent. Tiêu chuẩn tối ưu mới không phải là phân cấp thị giác mà là khả năng đọc máy. Điều này sẽ thay đổi cách chúng ta sáng tạo và công cụ chúng ta sử dụng. Agent tìm kiếm điều gì, đó là câu hỏi chúng ta chưa biết câu trả lời. Nhưng điều chúng ta biết là Agent đọc toàn bộ văn bản của một bài viết tốt hơn con người, còn con người có thể chỉ đọc vài đoạn đầu. Trên thị trường có rất nhiều công cụ, các tổ chức khác nhau dùng chúng để đảm bảo khi người tiêu dùng nhắc ChatGPT hỏi về thẻ tín dụng doanh nghiệp tốt nhất hoặc đôi giày tốt nhất, họ sẽ xuất hiện. Vì vậy trên thị trường có rất nhiều công cụ mà chúng tôi gọi là SEO (lưu ý: nên là SEO hoặc khái niệm tương tự, ở đây là phiên âm), mọi người đang sử dụng, nhưng ai cũng hỏi một câu: Agent AI muốn xem gì?
Stephanie Zhang 06:43 Tôi thích câu hỏi này, về việc khi nào con người có thể hoàn toàn rút khỏi vòng lặp. Chúng ta đã thấy điều này đang xảy ra trong một số trường hợp. Công ty trong danh mục đầu tư của chúng tôi là Dekagon đã tự động trả lời câu hỏi cho nhiều khách hàng của họ. Nhưng trong các trường hợp khác, như vận hành an ninh hoặc xử lý sự cố, chúng tôi thường thấy nhiều người vẫn trong vòng lặp, Agent AI sẽ cố gắng xác định vấn đề, phân tích và cung cấp các kịch bản tiềm năng cho con người. Đây thường là các trường hợp có trách nhiệm lớn hơn, phân tích phức tạp hơn, chúng tôi thấy con người sẽ ở lại vòng lặp. Và cho đến khi mô hình và công nghệ đạt độ chính xác cực cao, họ có thể sẽ ở lại lâu hơn.
Stephanie Zhang 07:33 Tôi không biết Agent có xem Instagram Reels không. Điều này thực sự thú vị, ít nhất về mặt kỹ thuật, tối ưu hóa khả năng đọc máy, tối ưu hóa insight, tối ưu hóa mức độ liên quan thực sự rất quan trọng, đặc biệt so với trước đây khi chúng ta chú trọng thu hút sự chú ý bằng cách phô trương. Chúng tôi đã thấy rất nhiều trường hợp nội dung siêu cá nhân hóa, có thể bạn không tạo ra một bài viết cực kỳ liên quan, cực kỳ sâu sắc, mà tạo ra lượng lớn nội dung chất lượng thấp, nhưng nhắm đến những điều bạn nghĩ Agent có thể muốn xem. Điều này gần như tương đương với nhồi nhét từ khóa thời đại Agent, chi phí sáng tạo nội dung gần như bằng 0, tạo ra lượng lớn nội dung trở nên rất dễ dàng. Đó là rủi ro tiềm ẩn của việc tạo ra lượng lớn nội dung để thu hút sự chú ý của Agent.
Olivia Moore 08:48 Tôi là Olivia Moore, đối tác nhóm đầu tư ứng dụng AI của chúng tôi. Ý tưởng lớn của tôi cho năm 2026 là Agent AI giọng nói sẽ bắt đầu chiếm lĩnh vị trí nhất định. Năm 2025, chúng ta thấy Agent giọng nói từ thứ tưởng như viễn tưởng đã bứt phá thành hệ thống thực tế được doanh nghiệp mua sắm và triển khai quy mô lớn. Tôi rất vui khi thấy nền tảng Agent giọng nói mở rộng, hoạt động đa nền tảng và chế độ, xử lý trọn vẹn nhiệm vụ, đưa chúng ta gần hơn với tầm nhìn về nhân viên AI thực thụ. Chúng tôi đã thấy gần như mọi lĩnh vực dọc đều có khách hàng doanh nghiệp thử nghiệm Agent giọng nói, nếu không muốn nói là đã triển khai ở quy mô khá lớn.
Olivia Moore 09:25 Chăm sóc sức khỏe có lẽ là lĩnh vực lớn nhất ở đây. Chúng tôi thấy Agent giọng nói xuất hiện ở hầu hết các phần trong chuỗi chăm sóc sức khỏe, bao gồm cả cuộc gọi cho công ty bảo hiểm, nhà thuốc, nhà cung cấp, cũng như các cuộc gọi hướng tới bệnh nhân có thể gây ngạc nhiên hơn. Đó có thể là các chức năng cơ bản như lên lịch và nhắc nhở, nhưng cũng bao gồm các cuộc gọi nhạy cảm hơn như gọi theo dõi sau phẫu thuật, thậm chí tiếp nhận bệnh nhân tâm thần lần đầu, đều do AI giọng nói xử lý. Thành thật mà nói, một động lực chính ở đây là tỷ lệ nghỉ việc cao và khó tuyển dụng trong ngành y tế hiện nay, khiến Agent giọng nói có thể thực hiện nhiệm vụ với độ tin cậy nhất định trở thành giải pháp khá tốt. Một lĩnh vực tương tự là ngân hàng và dịch vụ tài chính. Bạn có thể nghĩ ở đó có quá nhiều quy định và kiểm soát, AI giọng nói chưa thể hoạt động. Nhưng thực tế, đây là lĩnh vực AI giọng nói thể hiện tốt hơn, vì con người rất giỏi vi phạm quy định, còn AI giọng nói thì luôn thực hiện đúng. Và quan trọng là bạn có thể theo dõi hiệu suất của AI giọng nói theo thời gian. Cuối cùng, tôi muốn nói một lĩnh vực công nghệ giọng nói đột phá nữa là tuyển dụng. Điều này bao gồm từ công việc tuyến đầu bán lẻ đến vị trí kỹ sư mới vào nghề, thậm chí cả vị trí tư vấn trung cấp. Với AI giọng nói, bạn có thể tạo trải nghiệm cho ứng viên, họ có thể phỏng vấn ngay vào bất kỳ thời điểm nào phù hợp, rồi được chuyển sang quy trình tuyển dụng thủ công còn lại.
Olivia Moore 10:46 Khi các mô hình nền tảng ngày càng tốt hơn, năm nay chúng tôi đã thấy cải tiến lớn về độ chính xác và độ trễ. Thực tế, trong một số trường hợp, tôi nghe nói có công ty Agent giọng nói cố tình làm chậm tốc độ Agent hoặc thêm tiếng ồn nền để nghe giống con người hơn. Khi nói đến BPO (dịch vụ thuê ngoài quy trình kinh doanh) và trung tâm cuộc gọi, tôi nghĩ một số sẽ trải qua quá trình chuyển đổi nhẹ nhàng hơn, còn một số khác có thể đối mặt với "vực thẳm" khi đối mặt với mối đe dọa từ AI, đặc biệt là AI giọng nói. Giống như người ta nói, AI sẽ không lấy mất việc của bạn, nhưng một người sử dụng AI thì có thể.
Olivia Moore 11:16 Chúng tôi thấy nhiều khách hàng cuối cùng có thể vẫn chỉ muốn mua giải pháp, chứ không phải công nghệ họ phải tự triển khai. Vì vậy, trong ngắn và trung hạn, họ có thể vẫn dùng trung tâm cuộc gọi hoặc BPO. Nhưng họ có thể chọn nhà cung cấp có giá rẻ hơn hoặc xử lý được nhiều khối lượng hơn nhờ tận dụng AI. Thú vị là ở một số khu vực, tính theo nhân viên thường trực, con người thực ra vẫn rẻ hơn AI giọng nói hàng đầu. Vì vậy, khi mô hình tốt hơn, chi phí ở đó có giảm không, và các trung tâm cuộc gọi ở những thị trường đó có đối mặt với mối đe dọa lớn hơn hiện tại không, đó sẽ là điều rất đáng chú ý.
Olivia Moore 11:50 AI thực sự rất xuất sắc trong hội thoại đa ngôn ngữ và giọng nặng. Nhiều khi, tôi họp mà có từ hoặc cụm từ không nghe rõ, rồi tôi xem lại bản ghi (Granola) của mình, nó ghi lại rất hoàn hảo. Vì vậy tôi nghĩ đây là ví dụ điển hình mà hầu hết các nhà cung cấp ASR hoặc chuyển giọng nói thành văn bản đều làm được.
Olivia Moore 12:08 Hiện có một số trường hợp sử dụng mà tôi hy vọng năm sau sẽ thấy nhiều hơn, bất cứ thứ gì liên quan đến chính phủ. Chúng tôi là nhà đầu tư của Prepared 911, nếu bạn có thể xử lý cuộc gọi 911 - họ xử lý cuộc gọi không khẩn cấp - nhưng nếu bạn có thể dùng AI giọng nói cho việc đó, bạn cũng nên xử lý được cuộc gọi DMV (cục quản lý phương tiện) và bất kỳ cuộc gọi nào liên quan đến chính phủ khác, những cuộc gọi hiện rất gây khó chịu cho người tiêu dùng và cũng khó chịu không kém cho nhân viên ở đầu dây bên kia.
Olivia Moore 12:32 Tôi cũng rất muốn thấy nhiều AI giọng nói tiêu dùng hơn. Đến nay, nó chủ yếu là B2B (doanh nghiệp với doanh nghiệp), vì việc thay thế hoặc bổ sung con người trên điện thoại bằng AI rẻ hơn nhiều là điều quá rõ ràng. Trong lĩnh vực AI giọng nói tiêu dùng, một lĩnh vực khiến tôi hào hứng là xung quanh sức khỏe và chăm sóc sức khỏe rộng hơn. Chúng tôi đã thấy các bạn đồng hành AI giọng nói xuất hiện trong các cơ sở hỗ trợ sinh hoạt, viện dưỡng lão, vừa làm bạn với cư dân, vừa theo dõi các chỉ số sức khỏe khác nhau theo thời gian. Chúng tôi coi AI giọng nói là một ngành công nghiệp chứ không chỉ là một thị trường, điều này có nghĩa là ở mỗi tầng trong ngăn xếp công nghệ đều sẽ có người chiến thắng. Nếu bạn quan tâm đến AI giọng nói hoặc muốn khởi nghiệp trong lĩnh vực này, tôi khuyên bạn nên xem các mô hình đó. Có rất nhiều nền tảng tuyệt vời như 11 Labs, nơi bạn có thể thử tạo giọng nói và Agent giọng nói của riêng mình. Bạn sẽ có cái nhìn rõ về những gì có thể và điều gì sẽ xảy ra trong tương lai.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích

Chuyến bay Bitcoin: Các nhà đầu tư rút hơn 196.000 BTC khỏi các sàn giao dịch crypto
MicroStrategy chịu áp lực: Giá Bitcoin giảm và bị loại khỏi chỉ số ảnh hưởng đến cổ phiếu
Bitcoin tìm thấy hỗ trợ cấu trúc khi các tổ chức mua vào neo giữ mức $80,000
