🎤 爲偶像應援 · Gate送你直達 Token of Love! 🎶
家人們,現在在Gate廣場爲 打 Token of Love CALL,20 張音樂節門票等你來瓜分!🔥
泫雅 / SUECO / DJ KAKA / CLICK#15 —— 你最期待誰?快來一起應援吧!
📌 參與方式(任選,參與越多中獎幾率越高!)
1️⃣ 本帖互動
點讚 & 轉發本帖 + 投票你最愛的藝人
評論區打出 “我在 Gate 廣場爲 Token of Love 打 Call !”
2️⃣ 廣場發帖爲 TA 打 Call
帶上 #歌手名字# + #TokenOfLove#
發帖內容任選:
🎵 最想現場聽到的歌 + 心情宣言
📣 應援口號(例:泫雅女王衝鴨!Gate廣場全員打 Call!)
😎 自制表情包/海報/短視頻(加分項,更容易中獎!)
3️⃣ 推特 / 小紅書發帖打 Call
同樣帶上 #歌手名字# + #TokenOfLove#
內容同上,記得回鏈到表單 👉️ https://www.gate.com/questionnaire/7008
🎟️ 獎勵安排
廣場優質發帖用戶:8張門票
廣場幸運互動用戶:2張門票
Twitter 優質發帖用戶:5張門票
小紅書優質發帖用戶:5張門票
📌 優質帖文將根據文章豐富度、熱度、創意度綜合評分,禁止小號水貼,原創發帖更易獲獎!
🕒 8
OpenAI、谷歌雙標玩得溜:訓練大模型用他人數據,卻決不允許自身數據外流
編輯:杜偉、梓文
在生成式AI 盛行的全新時代,大型科技公司在使用在線內容時正在奉行「照我說的做,而不是做我所做的」策略。在一定程度上,這種策略可以說是一種雙標以及話語權的濫用。
同時,隨著大語言模型(LLM)成為AI 發展的主流趨勢,無論是大型還是初創公司,都在不遺餘力地開發自己的大模型。其中訓練數據是大模型能力好壞的重要前提。
近日,根據Insider 的報導,微軟支持的OpenAI、谷歌及其支持的Anthropic 多年來一直在使用其他網站或公司的在線內容來訓練他們的生成式AI 模型。這些都是在沒有徵求具體許可的情況下完成的,並將構成一場醞釀中的法律鬥爭的一部分,決定了網絡的未來以及版權法在這一新時代的應用方式。
這些公司很聰明,但也非常虛偽
大型科技公司使用他人在線內容卻不允許他人使用自己的,這種說法是否有確切證據,這可以從他們一些產品的服務和使用條款中看出端倪。
首先來看Claude,它是Anthropic 推出的類似於ChatGPT 的AI 助手。該系統可以完成摘要總結、搜索、協助創作、問答、編碼等任務。前段時間再次升級,將上下文token 擴展到了100k,處理速度大大加快。
Claude 的服務條款是這樣的。你不得以下列方式(這裡列舉出部分)訪問或使用本服務,如果這些限制的任何一項與可接受使用政策不一致或不明確,則以後者依從為先:
Claude 服務條款地址:
同樣地,谷歌的生成式AI 使用條款也是如此,「你不得使用本服務來開發機器學習模型或相關技術。」
OpenAI 的使用條款又怎樣呢?與穀歌類似,「你不得使用本服務的輸出來開發與OpenAI 競爭的模型。」
這些公司很聰明,他們知道高質量的內容對於訓練新的AI 模型至關重要,所以不允許別人用這樣的方式使用他們的輸出也是合情合理的。但他們卻無所顧忌地利用他人數據來訓練自己的模型,這又該如何解釋呢?
目前,OpenAI、谷歌和Anthropic 拒絕了Insider 的置評請求,並且沒有做出任何回應。
Reddit、推特和其他公司:受夠了
實際上,其他公司意識到正在發生的事情時並不高興。今年4 月,多年來一直被用於AI 模型訓練的Reddit 計劃開始對其數據的訪問收費。
Reddit 首席執行官Steve Huffman 表示,「Reddit 的數據語料庫非常有價值,因此我們不能把這些價值免費提供給世界上最大的公司。」
同樣今年4 月,馬斯克指責OpenAI 的主要支持者微軟非法使用Twitter 的數據來訓練AI 模型。 「訴訟時間到」,他在推特上寫道。
OpenAI 首席執行官Sam Altman 試圖通過探索尊重版權的全新AI 模型來深化這個問題。據Axios 報導,他於近期表示,「我們正在嘗試開發新的模式,如果AI 系統使用了你的內容,或者使用了你的風格,你就會因此獲得報酬。」
出版商(包括Insider)都會是既得利益獲得者。此外,包括美國新聞集團在內的一些出版商已經在推動科技公司付費使用其內容訓練AI 模型。
目前AI 模型的訓練方式「打破」了網絡
有前微軟高管表示這一定有問題。微軟老將、著名軟件開發者Steven Sinofsky 認為,目前AI 模型的訓練方式「打破」了網絡。
他在推特上寫道,「過去,爬取數據是用來換取點擊率的。但現在只是用來訓練一個模型,沒有給創作者、版權所有者帶來任何價值。」
也許,隨著更多公司的覺醒,生成式AI 時代這一不均衡的數據使用方式會很快被改變。
原文鏈接: