新聞

埃隆馬斯克計劃解放推特的算法

“Twitter 內部的人也想了解他們的算法是如何工作的,”他說。

Twitter、Facebook 和馬斯克沒有回應置評請求。

長期以來,推動人們在社交媒體網站上看到的內容的算法的不透明性一直令保守派著迷,特別是他們在沒有證據的情況下聲稱這些平台對他們有偏見。 馬斯克本週試圖在 Twitter 上獲得影響力,這讓右翼人士歡欣鼓舞,因為一些人猜測他可能會試圖減少對錯誤信息的監管,並使前總統唐納德特朗普恢復到該平台的地位。

一直在努力通過監管使算法更加透明。 去年,國會提出或重新提出了幾項法案,明確關注決定人們在社交媒體平台上看到什麼的軟件程序。 在全球範圍內監管人工智能和算法的努力也在推進。

當 Facebook 和 Twitter 等社交網絡是全新的時,沒有足夠的內容來保證需要復雜的算法,這本質上是一組類似於數學方程式的規則,有助於解析內容並確定與最相關的內容個人用戶。

但隨著數億用戶開始加入並發布數十億條內容,這些公司開始編寫軟件,可以了解用戶最有可能點擊的內容,然後對他們的提要進行相應的排序。

現在,Facebook、視頻應用程序 TikTok 和 Twitter 等公司都使用某種形式的算法來確定向用戶展示什麼。 這意味著並非社交網絡上的每個用戶都看到相同的東西。 痴迷於戶外活動的人可能會看到有關夏季最佳露營地的帖子,而籃球迷可能會被有關 NBA 季后賽的帖子轟炸。

埃隆馬斯克沒有在推特上發布他購買大量 Twitter 股份的推文,但他確實向追隨者詢問了一個關於 Twitter 的問題。

埃隆馬斯克沒有在推特上發布他購買大量 Twitter 股份的推文,但他確實向追隨者詢問了一個關於 Twitter 的問題。信用:美聯社

Facebook 和 Twitter 最初有按時間順序排列的信息流,最近它們都面臨著將它們作為默認信息恢復的壓力,尤其是在批評它們的排名系統有助於促進錯誤信息傳播的情況下。

大多數公司使用的複雜數學通常被稱為“機器學習”,其核心是一種非常奇特的模式識別形式。 計算機程序無法判斷特定推文是否有趣、有趣或有價值。 但是,如果它查看數百萬條推文和一系列因素,例如誰喜歡它、分享它和轉發它,它就可以開始預測哪些推文可能會受到關注。

計算機科學助理教授邁克爾·埃克斯特蘭德 (Michael Ekstrand) 表示,即使 Twitter 公開了它的秘密公式,包括它用來“訓練”其機器學習算法的數學,外人也無法從中得出有意義的結論。在博伊西州立大學研究推薦引擎。

局外人還需要查看用於“訓練”這些算法的基礎數據——數十億位數據顯示誰查看、喜歡或分享了推文,以及許多其他可能的因素。

專家說,發布這些數據會引發嚴重的隱私問題。

“該算法只是冰山一角,”科羅拉多大學博爾德分校信息科學教授、推薦算法研究專家 Robin Burke 說。 “冰山的其餘部分是 Twitter 擁有的所有這些數據,”他說,其中大部分數據無法公開發布。

專家說,馬斯克應該精通算法的複雜性。 他經營的公司特斯拉正在使用機器學習算法開發自動駕駛技術。 這項任務如此龐大,以至於特斯拉正在建造自己的超級計算機和定制半導體來處理所有數據。

專家們說,還有其他更實用的提高透明度的方法,其中一些推特已經在做。 一些批評者呼籲社交媒體公司簡化他們的算法,以便在出現問題時,比如對特定人群的偏見,可以更容易地得到解決。 其他人則呼籲在公司內部進行獨立審計。

Twitter 有一個名為 Machine Learning Ethics、Transparency and Accountability 的內部研究團隊,負責研究其算法中的潛在偏見。 例如,它已經發表了關於自動裁剪個人資料照片的算法是否包含無意偏見的研究。

即使馬斯克成功並且代碼被公開發布,批評者很可能會繼續懷疑它是否是完整的代碼,以及是否可以遺漏一些東西。

一個已經浮出水面的想法是將 Twitter 分成多種不同的算法。 Twitter 可以選擇有權訪問數據的業務合作夥伴,並開發針對特定受眾的算法。

專注於技術的作家集體 Every 的聯合創始人 Nathan Baschez 在周五的一篇文章中認為,Twitter 應該允許外部人員創建自己的算法,以滿足特定的興趣。 Twitter 聯合創始人傑克·多爾西(Jack Dorsey)回復了巴斯切斯(Baschez)發布的一條推文,證實他在去年 12 月卸任前擔任該公司首席執行官時提出了這個想法。

在 2020 年 11 月的國會證詞中,多爾西廣泛地提出了這個想法。 他說,算法“負責向我們展示我們看到的或沒有看到的,並且在使用它們時需要有更多的選擇。” Twitter 還資助了 Bluesky,該公司旨在分散社交媒體,部分原因是讓人們在組織信息流方面有更多選擇。

一位不願透露姓名討論私人事務的前 Twitter 員工表示,該公司已經考慮了一個“算法市場”,用戶可以在其中選擇不同的方式來查看他們的提要。 但這位知情人士說,事實證明,提高透明度的努力具有挑戰性,因為 Twitter 的算法與產品的其他部分有多麼緊密的聯繫。 這位人士說,打開它可能會洩露商業機密並招致濫用。

正在加載

Burke 表示,這個想法有其優點,但需要對 Twitter 的運營方式和數據流動方式進行重組。 “很難想像它會發生的事實表明這些社交媒體公司的整體性,”他說。

向公眾發布 Twitter 的代碼也可能產生負面影響。 專家說,那些旨在通過傳播虛假信息來影響選舉的人可以利用這些信息來操縱平台。

即使馬斯克成功並且代碼被公開發布,批評者很可能會繼續懷疑它是否是完整的代碼,以及是否可以遺漏一些東西。 從本質上講,這位億萬富翁會要求 Twitter 用戶相信他,幕後沒有犯規,就像該公司今天在其當前所有權下一樣。

“要消除所有的懷疑和憤世嫉俗可能是不可能的。 總會有人不相信所說的話,”埃克斯特蘭德說。

華盛頓郵報的雷切爾勒曼為本報告做出了貢獻。

華盛頓郵報