智快網 - 新科技與新能源行業網絡媒體

          微軟開源OmniParser,GPT-4V秒解析屏幕截圖,智能新突破!

             發布時間:2024-10-29 10:39 作者:楊凌霄

          微軟近日宣布了一項重大開源項目——OmniParser,這是一款專為解析和識別屏幕上可交互圖標設計的AI工具。傳統自動化方法受限于HTML或視圖層次結構,而現有的視覺語言模型在處理復雜GUI元素時又顯得力不從心。為此,微軟推出了這款純視覺基礎的工具,旨在解決當前屏幕解析技術的局限性。

          OmniParser結合了可交互區域檢測模型、圖標描述模型和OCR模塊,無需依賴HTML標簽或視圖層次結構等顯式基礎數據。這一特性使得它能夠在桌面、移動設備和網頁等多種平臺上跨平臺工作,顯著提高了用戶界面的解析準確性。OmniParser還能將識別出的屏幕元素轉換成結構化的數據。

          在實際測試中,OmniParser展現出了卓越的性能。在ScreenSpot數據集中,它的準確率提高了73%,遠超依賴HTML解析的模型。同時,當GPT-4V使用OmniParser的輸出后,圖標的正確標記率從70.5%提升至93.8%。這些改進充分證明了OmniParser在解決當前GUI交互模型根本缺陷方面的有效性。

          微軟已在Hugging Face上發布了OmniParser,這一舉措將有助于普及這一前沿技術,進一步推動多模態AI的發展,特別是在無障礙、自動化和智能用戶輔助等領域。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          日韩va中文字幕无码电影| 精品日产卡一卡二卡麻豆| 亚洲区日韩精品中文字幕| 久久亚洲精品无码网站| 久久亚洲AV无码精品色午夜 | 免费精品一区二区三区在线观看| 国产成人精品免费午夜app| 午夜精品乱人伦小说区 | 精品国产乱码欠欠欠欠精品| 久久久久久精品免费看SSS| 日产精品一线二线三线芒果| 国内精品91最新在线观看| 国产亚洲精品成人a v小说| 国产精品一区在线观看你懂的| 中文字幕一区日韩精品| 国产伦子系列麻豆精品| 国内精品视频一区二区三区八戒| 国产精品美女久久福利网站| 精品中文字幕久久久久久| 久久精品免费一区二区| 99国产精品视频免费观看| 国产成人A人亚洲精品无码| 人与狗精品AA毛片| 国产精品伦理久久久久久| 激情啪啪精品一区二区| 精品无码日韩一区二区三区不卡| 国产精品亚洲一区二区三区在线观看 | 国产成人精品视频播放| 中文字幕精品一区二区日本| 老汉精品免费AV在线播放| 久久亚洲精品国产精品黑人| 国产精品区一区二区三在线播放| 国产乱码精品一品二品| 又紧又大又爽精品一区二区| 国内一级特黄女人精品毛片| 日韩精品成人无码专区免费| 亚洲精品乱码久久久久蜜桃| 亚洲熟妇成人精品一区| 国产精品玖玖玖在线观看| 国产精品久久久久久五月尺| 99久久这里只精品国产免费|