Home 综合新闻 Wikimedia希望使您和人工智能開發人員更容易瀏覽其數據

Wikimedia希望使您和人工智能開發人員更容易瀏覽其數據

24
0

已故的英國作家道格拉斯·亞當斯(Douglas Adams)被稱為1979年的書​​作者 銀河系的搭便車指南。但是亞當斯比寫的更多 Wikipedia條目。不管你是否 需要 讓我們知道它有 胎記 它是鯨魚或世界各地的圖書館。它的書籍存儲在同一數字下 – 13230702 – 你 他可以 如果你去 被忽視的角度 來自Wikimedia基金會,稱為Wikidata。

那裡的圖片,文本,主要單詞和與亞當的其他信息都在A中。 網頁 對於我們之間的機器人,在為機器設計的協調中 傑森

現在,Wikidata獲得了一個對國際特赦組織友好的新數據庫,這使大型語言模型可以輕鬆食用信息。數據庫來自 維基百科包括項目 來自維基梅迪亞基金會的德語分會,負責監督Wikidata的Wikimedia Deutschend。基於柏林的團隊在過去的一年中使用了大型語言模型將總部設在總部,將1900萬個職位從完全組織的數據轉換為Wikidata,轉變為捕獲Wikidata引入的上下文和含義的向量。

在這種面紗的協調中,最好想像諸如與點和互連線的圖形之類的信息 – 亞當斯將與“人”以及他的書籍的地址鏈接到他的書籍,莉迪亞·班徹(Lydia Benchcher)和維基達塔(Wikidata)。 自由

雖然前端的用戶體驗將保持不變,但不,Wikipedia 項目負責人說,在構建聊天機器人時,後端將變得更容易到達人工智能開發人員到達。

Benchcher表示,該項目的目的是為Monied Big Tech定居。像Pintscher及其團隊一樣,Openai和Anthropic等公司擁有克服Wikidata的資源。它們是較小的衣服,不僅僅是對Wikidata酒窖中存儲的協調數據的新訪問權益。 “真的,對我來說,它給他們這個優勢並至少給了他們機會,對嗎?”本特說。

它指示 裁判 例如,Wikidata廣泛的數據項目一直贊助志願者。該法規允許用戶在全球政府官員中找到社交媒體手柄和電子郵件。

大多數AI聊天機器人優先考慮在線通用單詞和主題。本特說,除了提供一些小技術外,該團隊還希望將Wikidata訪問人工智能係統,這些系統更好地反映了並未在網上廣泛代表的專業主題。 “這可能是在Chatgpt中輸入信息的更好方法,例如,從生成大量內容,然後等待返回Chatgpt,或者也許是考慮到它的貢獻。 “

實際上,人工智能係統將使有關信息以及信息本身的上下文訪問。 自由

該團隊使用AI Jina AI的模型將結構Wikidata數據轉換為2024年9月18日,該數據被捕獲到矢量。 IBM Company DataStax當前提供基礎架構,以免費存儲該項目的數據庫。

該團隊正在等待開發人員的註釋,這些開發人員在使用數據庫中使用該數據庫進行更新,並使用過去一年中添加的信息進行更新。儘管當前的數據庫並未包含去年添加的全新信息,但Saadé表示,對當前Wikidata進行的微小修改或修改不會減少數據庫的好處。他說:“歸根結底,它類似於我們計算的向量是一個元素的一般思想,因此,如果對Wikadata進行了一些小的解放,則此事將不會高度相關。”

遵循主題和作者 從這個故事中,您可以在主頁上的主要簡報中看到更多這樣的信息,然後接收電子郵件更新。


來源連結

LEAVE A REPLY

Please enter your comment!
Please enter your name here