微軟公司于近期推出了一項名為“Windows Agent Arena”的基準框架,旨在評估生成式AI智能體在Windows PC上的性能表現。該框架為研究人員和開發者提供了構建和測試AI智能體的平臺。
AI智能體具備理解用戶請求并自主執行復雜操作的能力,可完成多達150項任務,如安裝瀏覽器擴展、修改文檔設置等。在Windows 11系統環境下,AI智能體的功能尤為突出。
例如,用戶只需簡單語音指令,AI智能體便能完成一系列早晨設置,如打開電子郵件、日歷和新聞網站,并匯總相關信息。AI智能體還能根據用戶需求調整系統設置或應用配置。
具體示例包括在Microsoft Edge中啟用“請勿追蹤”、在VSCode中安裝pylance擴展、更改搜索引擎、修改VLC設置以更改錄音存儲文件夾等。
微軟希望通過“Windows Agent Arena”吸引更多開發者參與構建AI智能體,推動AI技術的發展。盡管當前AI智能體的成功率仍有待提高,但其在理解和處理任務方面的能力正在不斷提升。
微軟的這一舉措不僅是推動AI智能體發展的重要一步,也為未來AI智能體學習用戶習慣、自動化日常任務、提高工作效率奠定了基礎。