Apple sử dụng công nghệ mới để so sánh dữ liệu tổng hợp với các email thực để đào tạo các mô hình AI, sau đó áp dụng các công cụ nhúng và quyền riêng tư để cải thiện chất lượng đầu ra văn bản
Apple dự kiến phát hành tính năng Siri cá nhân hóa rất được mong chờ vào tháng trước cùng với iOS 18.4. Tuy nhiên, tính năng này đã bị trì hoãn đến năm sau. Một báo cáo mới cho biết Apple huấn luyện các mô hình AI của mình bằng cách sử dụng email tổng hợp, đồng thời bảo đảm bảo mật thông tin người dùng. Mặc dù Apple đã xác nhận trì hoãn tính năng này đến năm sau, nhưng nhân viên trong công ty tin rằng nó sẽ sẵn sàng ra mắt vào cuối năm nay.
Trong một báo cáo mới, Bloomberg nêu bật cách Apple huấn luyện các mô hình AI cho Apple Intelligence. Báo cáo trích dẫn một bài viết từ trang web Nghiên cứu Machine Learning của Apple, mô tả việc Apple sử dụng dữ liệu tổng hợp để huấn luyện các mô hình AI. Trước đây, chúng tôi đã nhiều lần đề cập rằng Apple đang tụt lại trong cuộc đua AI so với các đối thủ, và chiến lược sử dụng dữ liệu tổng hợp để huấn luyện mô hình AI của công ty có phần khác thường và gặp một số hạn chế.
Việc tóm tắt hoặc viết email dài gặp khó khăn trong việc nhận diện xu hướng. Apple đã phát triển công nghệ mới cho phép so sánh dữ liệu tổng hợp với mẫu email gần đây của người dùng mà không xâm phạm quyền riêng tư. Để cải thiện mô hình, cần tạo ra nhiều email bao quát các chủ đề phổ biến trong tin nhắn.
Để xây dựng một bộ email tổng hợp đại diện, chúng tôi bắt đầu bằng cách tạo ra một tập hợp lớn các tin nhắn tổng hợp về nhiều chủ đề khác nhau. Ví dụ, chúng tôi có thể tạo tin nhắn tổng hợp như "Bạn có muốn chơi quần vợt vào ngày mai lúc 11h30 không?". Quá trình này diễn ra mà không cần biết thông tin về email của người dùng. Sau đó, chúng tôi tạo ra một đại diện, gọi là embedding, cho mỗi tin nhắn tổng hợp, phản ánh các khía cạnh chính của tin nhắn như ngôn ngữ, chủ đề và độ dài.
Các mã nhúng này được gửi đến một số thiết bị người dùng đã đăng ký tham gia Device Analytics. Các thiết bị tham gia sẽ chọn một mẫu nhỏ email gần đây và tính toán các mã nhúng của chúng. Mỗi thiết bị sẽ xác định mã nhúng tổng hợp nào gần nhất với các mẫu này. Nhờ vào công nghệ bảo mật riêng tư khác biệt, Apple có thể biết được các mã nhúng tổng hợp được chọn thường xuyên nhất trên tất cả các thiết bị mà không biết mã nào được chọn trên từng thiết bị cụ thể.
Các nhúng tổng hợp được chọn nhiều nhất có thể được sử dụng để tạo dữ liệu huấn luyện hoặc kiểm tra, hoặc chúng ta có thể thực hiện thêm các bước tinh chỉnh để cải thiện bộ dữ liệu. Ví dụ, nếu tin nhắn về việc chơi tennis là một trong những nhúng hàng đầu, ta có thể tạo ra một tin nhắn tương tự thay thế "tennis" bằng "soccer" hoặc một môn thể thao khác và thêm vào bộ dữ liệu cho vòng tinh chỉnh tiếp theo.
Quy trình này giúp chúng tôi cải thiện nội dung và ngôn ngữ của các email tổng hợp, từ đó nâng cao khả năng của các mô hình trong việc tạo ra văn bản tốt hơn, như tóm tắt email, đồng thời bảo vệ quyền riêng tư. Công ty nhận thức được những hạn chế, nhưng cho biết công nghệ mới sẽ giúp hiểu rõ hơn về xu hướng tổng thể mà không làm ảnh hưởng đến quyền riêng tư của người dùng hay thu thập thông tin.
Bloomberg cũng cho biết công ty sẽ phát hành công nghệ mới trong bản beta iOS 18.5 và macOS 15.5. Bạn có thể xem bài đăng đầy đủ của Apple để biết thêm chi tiết.
Nguồn: wccftech.com/apple-using-new-tech-to-train-ai-models-for-apple-intelligence/