科技媒體 AndroidAuthority 昨日(11 月 21 日)發(fā)布博文,報道稱谷歌正為安卓16 系統(tǒng)開發(fā)全新 API,可以讓 Gemini 代表用戶,操作其他應用交互。
現(xiàn)狀
援引博文介紹,谷歌希望將 Gemini 打造成手機上的真正 AI 智能體,實現(xiàn)谷歌曾對 Pixel 4 的 Google Assistant 許下的承諾。
Gemini 目前主要通過擴展程序,訪問 Google Flights、Google Hotels 等網(wǎng)絡服務,從而在用戶提出相關問題后,從中提取數(shù)據(jù)并回答相關問題。
但這種方式擴展性有限,難以覆蓋海量 Android 應用。雖然理論上 Gemini 可通過屏幕閱讀、多模態(tài) AI 等技術控制任何應用,但效果并不理想。
進化:從擴展到 API
這個新 API 的核心是“應用功能”(app functions),應用開發(fā)者可以通過定義服務來創(chuàng)建相關功能,并將其分享給 Android 的 App Search 框架。
“應用功能”具有唯一標識符,例如“orderFood”,系統(tǒng)應用可以通過 EXECUTE_APP_FUNCTIONS 或 EXECUTE_APP_FUNCTIONS_TRUSTED權限執(zhí)行這些功能。
EXECUTE_APP_FUNCTIONS
EXECUTE_APP_FUNCTIONS_TRUSTED
其中 EXECUTE_APP_FUNCTIONS_TRUSTED權限具有更高的安全級別,應用開發(fā)者可以選擇僅允許擁有此權限的應用執(zhí)行其功能。