Linq 的 AI 檢索模型登頂 HuggingFace MTEB 排行榜

「加三嘻行動哇 Yipee! 成為好友」

【Facebook、Youtube、Twitter、Instagram、Telegram、Line】

生成式 AI 新創公司Linq宣布，其大型嵌入模型「Linq-Embed-Mistral」在HuggingFace的「大規模文本嵌入基準（MTEB）」排行榜文本檢索評估中名列第一，超越了NVIDIA、Salesforce、Google、OpenAI和Cohere等競爭對手。這項評估由全球最大的機器學習平台HuggingFace負責。

Linq的嵌入模型在文本檢索類別中獲得了60.2分，高居榜首，領先於NVIDIA（59.4分）和Voyage AI（58.3分）。Google的模型以55.7分位居其後，OpenAI和Cohere分別獲得55.4分和55.0分。

Massive Text Embedding Benchmark (MTEB) BEIR Retrieval Score in HuggingFace. as of May 30, 2024. (PRNewsfoto/Linq (Wecover Platforms Inc))

HuggingFace的MTEB排行榜對嵌入模型在分類、聚類、成對分類、重排序、檢索、語義文本相似度（STS）和摘要這七個類別中的表現進行了排名。Linq的嵌入模型不僅在文本檢索類別中表現出色，在其他類別中也居於領先，總體排名第三。

MTEB總共列出了300多個嵌入模型，顯示出嵌入模型技術領域的激烈競爭態勢。Linq在這項基準測試中的優異表現證明了其在嵌入模型技術方面的領先優勢。

嵌入模型在生成式AI中至關重要，特別是在通過採用檢索增強生成（RAG）技術解決大語言模型（LLM）的幻覺問題方面。RAG技術允許模型通過訪問LLM內部不可用的最新數據或內部文檔來產生更可靠的輸出。

負責該項目的Junseong Kim博士表示：「我們的研究表明，由於檢索數據具有廣泛的主題多樣性和高難度，GPT生成的數據並不完美，需要進行徹底驗證和改進。通過這些過程，輸出的質量可以提升到與人工標記數據相當的水平，最終基於MTEB基準數據集達到最佳檢索性能。研究結果顯示，通過使用GPT對數據進行精心優化和篩選，我們可以創建出針對RAG進行優化的模型，並最大限度地提高在特定領域的性能。」此外，他還強調：「重要的不僅僅是數據的改進，訓練方法的優化和快速的實驗週期也是提高檢索性能的關鍵。」

Linq聯合創始人兼首席執行官Jacob Choi說道：「準確的搜索對於生成式AI企業提高採用率至關重要。我們很自豪能夠開發出有助實現這一目標的核心嵌入模型，並且我們還將不斷擴展和完善該模型，以確保在金融和法律等專業領域提供精確的文本搜索。」Choi指出，2023年，ChatGPT的出現讓生成式AI的B2C（企業對消費者）用例開始興起。到了2024年，隨著準確性和安全技術的不斷改進，B2B（企業對企業）應用也將迎來顯著增長。

延伸閱讀：

調研公布 2024 年第一季全球智慧手機出貨量，Apple 蘋果敗給了 Samsung 三星

Omdia 預測 2024 年下半年起 FPD 平板顯示器工廠使用率將恢復增長

Vantage 與 NEOM McLaren Extreme E 賽車手 Cristina Gutiérrez 共慶母親節

Techinsights 分析 2024 年Q1 全球平板出貨量復甦，Apple 蘋果持續領先、小米增加 117%

NTT Security Holdings 《2024 年全球威脅情資報告》，勒索軟體事件在 2023 年激增 67%

圖片及資料來源：美通社、Linq