ChatGPT là tất cả những gì thế giới công nghệ có thể nói đến gần đây và với lý do chính đáng. Công cụ do AI cung cấp rất ấn tượng, nhưng cũng có nhiều lo lắng—vi phạm bản quyền, đạo văn, sử dụng trong lớp học, thậm chí mất việc làm, vì vậy không có gì lạ khi những người viết lách đang căng thẳng về việc AI dường như có thể viết tốt. Nhưng cũng có những công ty công nghệ tinh mắt nhìn thấy tương lai – khả năng máy tính trò chuyện một cách tự nhiên và tạo ra nội dung mà các doanh nghiệp thực sự có thể sử dụng ở quy mô và chi phí mà con người không thể hy vọng sánh được.
Nhưng ChatGPT, Google Bard và Microsoft’s Trò chuyện trên Bing chỉ là một phần nhỏ của cuộc cách mạng trí tuệ nhân tạo. Thế giới nghệ thuật đã xôn xao về các công cụ nghệ thuật AI sáng tạo mới trong năm qua và lo lắng về những vấn đề tương tự – thiên vị, bản quyền, mất việc làm, v.v. của tảng băng trôi.
Những công cụ này không chỉ là chớp nhoáng. Họ đang ở giai đoạn trứng nước và đang trở nên tốt hơn rất liên tục. Các công ty công nghệ lớn như Google và Microsoft coi AI thế hệ mới này là một phần quan trọng trong tất cả các tương lai của chúng ta. Khẳng định quyền sở hữu và xây dựng vị trí lãnh đạo cũng quan trọng đối với họ như việc thống trị trang web vào những năm 90.
Nhưng có một người chơi không tham gia trò chơi: Apple. Công ty công nghệ có giá trị nhất trên trái đất dường như hoàn toàn bỏ lỡ một cuộc cách mạng toàn diện về điện toán. Apple không xa lạ gì với AI—hãng đã tạo ra một cuộc cách mạng về trợ lý ảo với Siri—nhưng hãng cũng đã phung phí vị trí dẫn đầu của mình do không đầu tư đủ mạnh để chống lại các đối thủ cạnh tranh.
Có phải lịch sử đang lặp lại với AI thế hệ mới? Hay Apple có một thứ gì đó tuyệt vời trong tay và đang cực kỳ bí mật, như mọi khi?
Trò chuyện AI đã cũ, sáng tạo AI mới
Tất cả các công ty công nghệ lớn nhất đã tập trung vào AI trong nhiều năm. AI tách biệt và phân tích cú pháp lời nói của bạn để đọc chính tả và trợ lý giọng nói, đồng thời có thể phân biệt giữa các giọng nói để mang lại kết quả được cá nhân hóa. AI ghép các âm thanh đã ghi lại với nhau để “nói chuyện” với bạn. AI cô lập các phần của hình ảnh để dễ dàng chỉnh sửa chúng. AI xác định đối tượng và con người để hỗ trợ tìm kiếm của bạn. AI cho phép bạn chọn văn bản trong bất kỳ hình ảnh nào.
Apple làm tất cả những thứ này. Điều quan trọng đối với công ty là họ phải xây dựng Công cụ thần kinh trong tất cả các chip của mình, phần cứng chuyên dụng giúp tăng tốc các tác vụ học máy như thế này. Apple thậm chí đang nghiên cứu thách thức AI lớn nhất trong tất cả, xe tự lái.
Nhưng trí tuệ nhân tạo là một cái gì đó khác. Đó là một lớp AI mới hơn, tạo ra thứ gì đó hoàn toàn mới mà hầu như không sử dụng kiểu nhập văn bản. Đúng vậy, việc đào tạo các mô hình tốn rất nhiều thời gian và hàng núi dữ liệu, nhưng khi đó những mô hình mà người dùng sẽ chạy tương đối nhỏ và dường như có thể tạo ra vô số nội dung mới. AI có thể tìm thấy tất cả khoai tây trong thư viện ảnh của bạn là một thứ hoàn toàn khác với AI có thể vẽ một củ khoai tây từ đầu theo nhiều phong cách nghệ thuật khác nhau.

Mark Hachman / IDG
ChatGPT, Bard và Bing
Công nghệ AI sáng tạo đang gây chú ý hiện nay là ChatGPT từ OpenAI. Chatbot nâng cao và các công cụ được xây dựng dựa trên nó đã được sử dụng trong thế giới kinh doanh để tạo các bài báo, email, mẫu, v.v., với một số tranh cãi. Học sinh đang sử dụng nó để viết toàn bộ bài báo từ một dấu nhắc nhỏ và kết quả đủ tốt để có một cuộc chạy đua phát triển các công cụ tốt giúp giáo viên xác định các bài tập do ChatGPT viết.
Bởi vì nó được đào tạo với rất nhiều dữ liệu web, mặc dù đã lỗi thời nhưng vẫn có liên quan đến nhiều thứ, nên nó gần giống như một công cụ tìm kiếm mà bạn trò chuyện. Điều này khiến Google lo lắng đến mức họ đã công bố sản phẩm AI đàm thoại đối thủ của riêng mình, Bard, sản phẩm chưa hoàn toàn sẵn sàng để thế giới dùng thử nhưng sẽ sớm ra mắt. Một bản demo công khai đã cung cấp thông tin sai về Kính viễn vọng Không gian James Webb, vì vậy Google rõ ràng có việc phải làm.
Microsoft cũng đã công bố một tính năng tìm kiếm đàm thoại mới mà bạn có thể bắt đầu sử dụng ngay bây giờ trong trình duyệt Bing và Edge. Nó được xây dựng trên ChatGPT với một số cải tiến và sửa đổi.
Đây không chỉ là đồ chơi hay sự tò mò. Đây là những công cụ thực sự mà mọi người đang sử dụng để thực hiện công việc thực tế và thúc đẩy các dự án sáng tạo. Đó là tất cả những ngày đầu và đôi khi có vẻ như nó chưa sẵn sàng cho thế giới nói chung, nhưng tốc độ cải tiến và đổi mới thật đáng kinh ngạc–các mô hình AI đang tăng gấp đôi về độ phức tạp và tinh vi sau mỗi sáu tháng.
Khuếch tán ổn định, Giữa hành trình, DALL-E
Và nó không chỉ là chữ viết. Tất cả chúng ta đã có một trận cười sảng khoái khi đưa ra những gợi ý ngớ ngẩn với DALL-E 2 vào năm ngoái, nhưng với việc đào tạo và cải tiến thêm, những công cụ nghệ thuật AI sáng tạo này đã trở nên hữu ích cho nhiều mục đích hơn là chỉ tạo ra hình ảnh những chú mèo theo phong cách anime đang lặn biển với bể cá. người đứng đầu của họ.
Midjourney và Stable Diffusion đã phát triển tốt đến mức họ đang tạo ra tác phẩm nghệ thuật có thể dễ dàng xuất hiện trên trang bìa của một tạp chí–và có thể tạo ra hàng tá tác phẩm trong vài phút.
Những công cụ này có thể làm được nhiều việc hơn là chỉ tạo ra những hình ảnh hoàn toàn mới với nhiều phong cách khác nhau. Họ có thể thay đổi hình ảnh đầu vào. App Store đã tràn ngập các ứng dụng tạo hình đại diện và hồ sơ sử dụng phần mềm này để chụp một vài bức ảnh về khuôn mặt của bạn và sửa đổi chúng theo những cách tuyệt vời bằng cách thay đổi các đặc điểm cơ thể mà không ai thông thái hơn. Chẳng hạn như đeo kính râm trông hoàn toàn thật.
Năm ngoái, đó là một mánh lới quảng cáo, nhưng công nghệ này đang phát triển nhanh đến mức nó đã trở thành một công cụ. Adobe đã cải thiện rất nhiều ứng dụng của mình bằng các công cụ tạo hình ảnh do AI cung cấp, để khôi phục ảnh bằng một cú nhấp chuột và xóa đối tượng được cải thiện rất nhiều. Nhưng công ty có kế hoạch thêm AI tổng quát đáng kể vào bộ công cụ của nó sớm, cho phép bạn chèn hình ảnh vào các bức ảnh và tác phẩm nghệ thuật hiện có trông phù hợp với chúng.

Dall-E 2 không chỉ là một trò tiêu khiển thời gian thú vị để tạo ra những hình ảnh lập dị.
Dalle2.app
Một cửa sổ hẹp để hành động
Và Apple ở đâu trong tất cả những điều này? Công ty đã định vị mình là công ty dẫn đầu về công nghệ, đặc biệt là trong lĩnh vực sáng tạo. Nhưng ngoại trừ một số bài đăng trên blog từ một trang web nghiên cứu ML và một số tối ưu hóa tương đối ít nỗ lực cho các thư viện dành cho Apple silicon, Apple dường như được ngồi cái này ra. Ý tôi là, tôi nghĩ Divam Gupta’s DiffusionBee cực kỳ tuyệt vời, nhưng đó là một ứng dụng nhỏ độc lập của bên thứ ba chưa được cập nhật trong một thời gian dài và đã đi sau công nghệ tạo hình ảnh AI tiên tiến nhất.
Công nghệ này sẽ được biến đổi hoàn toàn. Không tin tôi? Xem nghiên cứu của OpenAI về tạo nhạc. Nó tạo ra âm nhạc mới theo nhiều phong cách khác nhau, bao gồm cả một số bài hát, hoàn toàn không biết từ đâu. VALL-E của Microsoft có thể tạo ra giọng nói chân thực đến kinh ngạc, âm thanh rất gần với người thật, chỉ sử dụng một đoạn nhỏ giọng nói của người đó làm đầu vào. Nó thậm chí có thể bắt chước các trạng thái cảm xúc khác nhau.
Nhiều dự án trong số này và hàng chục dự án khác vẫn đang trong giai đoạn nghiên cứu. Không khó để tìm thấy một số sai sót với bất kỳ ai trong số họ. Nhưng hành trình từ nghiên cứu đến thế giới thực sẽ nhanh chóng và những sai sót sẽ trở nên khó tìm thấy.
Apple dường như có các công cụ để xây dựng chatbot AI chung của riêng mình với Neural Engine được tích hợp trong chip iPhone và Mac có khả năng lên tới 15,8 nghìn tỷ hoạt động mỗi giây, cùng với Core ML và API máy học. Nhưng chúng tôi chưa thấy bất kỳ chuyển động nào từ bên trong Cupertino. Và đó là một trong những di chuyển nhanh chóng.
Nếu bạn không xem không gian này, có thể bạn sẽ không nhận ra nó đang phát triển nhanh như thế nào. Phải mất một năm để AI tổng hợp đi từ “đồ chơi dự án nghiên cứu trực tuyến ngớ ngẩn” thành “thông báo đấu tay đôi từ Microsoft và Google”. Trong hai năm nữa, những công cụ này sẽ tốt hơn gấp mười lần và sẽ có rất nhiều công cụ khác. Bạn sẽ khó phân biệt đâu là thật hay hoàn toàn do AI tạo ra ngoài không khí. Nếu bạn có những ý tưởng lớn nhưng kỹ năng nghệ thuật hạn chế, AI sáng tạo sẽ giúp bạn thực hiện ước mơ dễ dàng hơn rất nhiều.

Chip Mac M1 và M2 của Apple có Công cụ thần kinh chuyên dụng có khả năng
người đàn ôngy nghìn tỷ hoạt động mỗi giây.
Quả táo
Với Siri, Apple đã đi đầu trong việc đưa trợ lý giọng nói AI đến với đại chúng. Khi công nghệ đó phát triển, Apple đã tụt lại phía sau và giờ đây Siri thường bị coi là nỗi thất vọng không thể so sánh với Google Assistant hoặc Alexa. Khi nói đến trí tuệ nhân tạo AI, Apple thậm chí không có lợi thế của người đi đầu như đã làm với Siri. Các công ty công nghệ lớn và nhỏ đã cung cấp các công cụ mạnh mẽ. Nếu không có hành động, Apple sẽ chỉ đơn giản là kết thúc việc tạo ra một số phần cứng mà tương lai dựa trên trí tuệ nhân tạo AI của chúng ta sẽ chạy trên đó.
Nếu không nhận ra sức mạnh của công nghệ mới này trong phần mềm và dịch vụ của riêng mình, Apple sẽ để mọi người khác xác định trạng thái nghệ thuật cho những gì có thể là sự thay đổi quan trọng nhất trong điện toán trong nhiều thập kỷ. Có lẽ công ty không sao với điều đó, nhưng khi doanh số bán phần cứng đi ngang và mảng kinh doanh phần mềm và dịch vụ của Apple phát triển, hãng thực sự không thể không trở thành người dẫn đầu trong cuộc cách mạng AI sáng tạo.
Tất nhiên, Apple là một trong những công ty bí mật nhất trong lĩnh vực công nghệ, đặc biệt là khi nói đến phần mềm. Apple có thể có các nhóm lớn làm việc chăm chỉ để mang các tính năng AI tổng quát đến iMovie, Final Cut Pro, Logic Pro, Photos, Mail, Messages và toàn bộ bộ iWork. Tất cả những điều này có thể được chuyển đổi hoàn toàn bằng các công cụ AI mạnh mẽ. Chúng tôi biết Apple đã mua ít nhất một công ty AI lớn, AI Music, khoảng một năm trước. Sẽ không phải là vô lý khi thấy ít nhất một công cụ “tạo bản nhạc gốc tức thì cho video của bạn” trong các sản phẩm của Apple trong năm nay.
Chúng ta có thể không nghe thấy gì về AI thế hệ mới của Apple, và sau đó tại WWDC, BAM! Trí tuệ nhân tạo đẳng cấp thế giới trên tất cả các sản phẩm của Apple!
Tôi hy vọng đó là trường hợp, bởi vì nếu Apple chậm trễ trong cuộc chơi về một công nghệ biến đổi như vậy, thì phần mềm của họ sẽ bị tụt lại phía sau các đối thủ cạnh tranh trong nhiều năm tới.