日本精品aⅴ一区二区三区|国产欧美一二三区|国产乱码精品精|国产精品电影在线免费

      1. <blockquote id="utafg"><th id="utafg"></th></blockquote>
    1. <div id="utafg"></div>
        <blockquote id="utafg"><th id="utafg"></th></blockquote>

        <menuitem id="utafg"></menuitem>
      1. 您現(xiàn)在的位置是:首頁 >互聯(lián)網(wǎng) > 2021-01-11 13:58:03 來源:

        微軟開源支持Bing的核心算法之一

        導(dǎo)讀 微軟公司今天 將其Bing搜索引擎的基礎(chǔ)算法之一開源,以幫助開發(fā)人員構(gòu)建更快,更易于導(dǎo)航的應(yīng)用程序。根據(jù)許可的MIT許可,可以使用空間分

        微軟公司今天 將其Bing搜索引擎的基礎(chǔ)算法之一開源,以幫助開發(fā)人員構(gòu)建更快,更易于導(dǎo)航的應(yīng)用程序。

        根據(jù)許可的MIT許可,可以使用空間分區(qū)樹和圖形算法(簡稱SPTAG)。Microsoft已將其捆綁到一個包含工具的庫中,該工具可幫助開發(fā)人員將代碼合并到他們的項目中。

        SPTAG可以使Bing即時顯示相關(guān)的搜索結(jié)果,即使用戶輸入的查詢無法通過簡單地將關(guān)鍵字與網(wǎng)頁匹配來處理。例如,查找“最大的湖泊”一詞會調(diào)出一個面板,其中包含有關(guān)蘇必利爾湖的信息,即使只有一個共享詞也是如此。

        SPTAG通過將查詢轉(zhuǎn)換為稱為向量的數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)這一點。向量本質(zhì)上是一長串?dāng)?shù)字,可以封裝從單個單詞到整個網(wǎng)頁的各種信息。

        將不同的記錄轉(zhuǎn)換為通用數(shù)字格式的好處是可以更輕松地比較它們。短語“最大的湖泊”的向量將與Bing從Wikipedia頁面“按地區(qū)列出的最大湖泊列表”的文本中產(chǎn)生的向量具有相似之處。在該Wikipedia頁面上,蘇必利爾湖排名第一。

        Bing根據(jù)相似性將代表Web內(nèi)容的向量分組,以加快搜索速度。“一旦將數(shù)字點分配給一條數(shù)據(jù),就可以排列或映射矢量,并在彼此附近放置接近的數(shù)字以表示相似性。這些最接近的結(jié)果將顯示給用戶,從而改善搜索結(jié)果。”微軟在博客中詳細介紹。

        據(jù)該公司稱,SPTAG使Bing能夠在幾毫秒內(nèi)篩選數(shù)十億條數(shù)據(jù)。搜索引擎可以訪問超過1500億個向量的存儲庫,并通過網(wǎng)絡(luò)上的新內(nèi)容不斷擴展。

        SPTAG的一項顯而易見的應(yīng)用是為協(xié)作服務(wù),電子郵件客戶端和其他文本大量應(yīng)用程序的用戶改善搜索體驗。但是該算法不限于處理書面內(nèi)容。SPTAG還能夠為圖像和音頻文件生成矢量,這意味著開發(fā)人員可以使用它來構(gòu)建高級功能,例如自動照片比較。

        SPTAG在GitHub上可用。

        最新文章