男性角色

檔名：1773842099463.jpg-(4 KB, 300x168)

三木谷浩史(樂天社長)無名26/03/18(三)21:54:59 ID:Laorex2UNo.3277049del

自稱要打造日本最強ai
最後搞了2年多的ai戰略端出來的成果就是抄襲
抄襲就算了還抄中國的deepseek實際上樂天自己只做了日文化界面和反和諧而已本質上還是deepseek
樂天ai的推特評論區一半是暴怒的日本網右大罵樂天賣國幫中國偷資料
剩下一半是來特地來嘲諷的中國人

無名26/03/18(三)22:10:05 ID:XeiFDtDANo.3277053del

那些吵的網民很多根本沒搞清楚狀況
RakutenAI是完全開源，真的是deepseek換皮他開源給人看做什麼？
而且deepseek沒真開源，RakutenAI是要怎麼拿來換皮？

無名26/03/18(三)22:30:56 ID:.rziUVkANo.3277061del

>>3277049
重點不是用哪國貨
是樂天要做本國llm求政府補助
補助款下來成品竟然是外國貨換皮
這不管在哪國都是妥妥的詐欺+背信

無名26/03/18(三)23:16:55 ID:rlHk8y4sNo.3277086del

>>3277053
Deepseek是真開源，不然你以為他去年突然爆紅是為什麼
>>3277061
沒，日本政府給的預算本來就是叫樂天在開源模型上建立自己的ai
你可以去看看Geniac計畫，日本政府給的預算不可能自建一個全新的大模型
甚至拿開源的Deepseekv3重新訓練都沒辦法，成本太高了
樂天的做法是唯一可行的做法，他唯一的錯就是說日本的ai
至於什麼偷資料就是外行人說幹話了

無名26/03/18(三)23:18:32 ID:F6loK6xkNo.3277087del

>>3277086
有很多人蠢到會把個人資料上傳給AI平台的
不騙

無名26/03/18(三)23:19:40 ID:rlHk8y4sNo.3277089del

>>3277087
開源就是叫你下載下來建立本地模型，你是要上傳甚麼？

路過的AI工程師26/03/18(三)23:28:29 ID:pcZ1202gNo.3277093del

>>3277089
你以為人人都有100多G顯存可以隨便跑大型LLM啊
不要拿量化模型說嘴
Q8以下的模型都是語障+腦殘
連最基本的指令都做不好

無名26/03/18(三)23:30:17 ID:rlHk8y4sNo.3277095del

目前開源模型最強就是deepseek，而且完全開放授權使用
日本如果想要自己訓練一個Llm，沒有個3萬張h100是做不到的，還不一定會成功，美國的ai人才有一半都是華裔，日本？

算了，還是別浪費時間金錢吧

無名26/03/18(三)23:31:26 ID:rlHk8y4sNo.3277097del

>>3277093
樂天這種等級當然是直接下載完整的Deepseek作本地部署啊

無名26/03/18(三)23:35:07 ID:XeiFDtDANo.3277099del

>>3277086
>Deepseek是真開源，不然你以為他去年突然爆紅是為什麼
就不是，他是假開源這個當初就吵過了
https://huggingface.co/Rakuten/RakutenAI-3.0
Deepseek可沒樂天這樣

無名26/03/18(三)23:42:07 ID:rlHk8y4sNo.3277105del

>>3277099
都公開權重，可本地部署，可以商業使用，允許微調後散佈
做到這種程度還不叫開源，我不知道什麼才叫開源了

無名26/03/18(三)23:44:42 ID:pcZ1202gNo.3277106del

>>3277095
>目前開源模型最強就是deepseek，而且完全開放授權使用
早就被打爆了好嗎老外論壇都是在用qwen
寫程式和解數學問題的能力還遠弱於minimax等其他模型
而其他比deepseek弱的模型都有多模態的視覺能力了就你還沒有
你不懂目前AI生態就別來亂吹了吧

>>3277097
部署在他們本地不就代表使用者還是上傳資料給他們的伺服器進行運算?

無名26/03/18(三)23:46:05 ID:pcZ1202gNo.3277108del

>>3277105
開源的是蒸餾過的弱化版
掛在他們伺服器上運作的那一版沒有開源
其實就跟openai一樣罷了

無名26/03/18(三)23:51:02 ID:rlHk8y4sNo.3277113del

>>3277106
部署在樂天的伺服器，為什麼會是幫中國偷資料？懂？

無名26/03/18(三)23:57:41 ID:pcZ1202gNo.3277119del

>>3277113
>有很多人蠢到會把個人資料上傳給AI平台的
我是附和這句話
幫中國偷資料又不是我說的

無名26/03/18(三)23:59:48 ID:rlHk8y4sNo.3277120del

>>3277119
原話是幫中國偷資料
問題是樂天自己本地部署不可能發生這種事

無名26/03/19(四)00:05:23 ID:VYDfUQXANo.3277121del

>>3277120
干我屁事
我只要證明我附和的論點是正確的就夠了

無名26/03/19(四)00:05:24 ID:vCqRITfQNo.3277122del

>>3277105
就跟你講當初吵過了所以才講假開源
真開源去看樂天那個網址，那個才叫真開源
deepseek相比之下頂多只能算開放素材，開放的還沒騰訊混元多呢

無名26/03/19(四)00:14:47 ID:9s4vHcIYNo.3277127del

>>3277061
>補助款下來成品竟然是外國貨換皮
>這不管在哪國都是妥妥的詐欺+背信
正常國家的話啦

無名26/03/19(四)00:42:56 ID:8xbgmj7oNo.3277139del

>>3277049
日本就算了, 台灣明明是全世界最不缺晶片的地方, 竟然連一個deepseek級數的大模型也生不出來

無名26/03/19(四)01:03:28 ID:7DTldojwNo.3277149del

>>3277139
因為你是個智障才會覺得做石油公司一定也是全球最大的成衣製造商

然後deepseek這玩意兒早就被看破是堆錢+蒸別人的數據搞出來的玩意兒，真的要做AI也不是做成你deepseek這種鬼玩意兒

無名26/03/19(四)05:32:51 ID:i/AqQr5cNo.3277169del

>>3277149
對對對
吃不到的葡萄一定是酸的

無名26/03/19(四)05:37:18 ID:DAN.DC56No.3277170del

上次不是才有中國官員被openai發現用他們的東西搞網軍戰術，所以為何不用自己的deepseek?

無名26/03/19(四)05:42:19 ID:ADZyCMdMNo.3277171del

>>3277139
>>台灣明明是全世界最不缺晶片的地方
因為那堆晶片都是國外訂單
台灣不能拿來自用

無名26/03/19(四)05:58:11 ID:JoDm4M5YNo.3277173del

>>3277169

葡萄酸就酸啊,反正賣葡萄的錢有收到就好

無名26/03/19(四)07:33:06 ID:qCTZchBsNo.3277183del

>>3277149
哪來的智障
Ai本來就是極度燒錢的東西
蒸別人的數據更搞笑，ai本來就是到處拿人的數據來用，沒有例外
Claude還因此吃官司

無名26/03/19(四)07:40:34 ID:mRnrPSrkNo.3277188del

>>3277139
台灣是用在工業製造了
向台積那些和NV合作的公司,不相信沒有

無名26/03/19(四)08:15:15 ID:qCTZchBsNo.3277194del

>>3277188
Ai是軟體
晶片是鏟子，兩個根本沒關系就是

無名26/03/19(四)08:36:22 ID:SfYjICEANo.3277202del

承認吧台灣就是連抄AI數據能力的人才都沒有

無名26/03/19(四)08:42:18 ID:kBF/9yQUNo.3277204del

>>3277183
蒸餾攻擊了解一下
https://techorange.com/2026/02/13/google-gemini-distillation-attacks/
訓練和直接用模型蒸餾是兩件事
找資料訓練你還要花時間做訓練集手工標記大量資料
還要做資料清洗最後才變成可以丟給AI訓練的狀態
AI最花錢費工的部分其實也是在這邊
你直接用別人的模型蒸餾就等於是跳過這過程
沒有別人辛苦花成本弄出來的基礎模型你什麼屁都蒸餾不出來
還有這已經不只是盜數據的問題了
實際是連算力也一起盜
記得之前還有白癡信勢旦旦地說線上部署的模型沒辦法蒸餾
現在人家直接貼數據給你看了www

無名26/03/19(四)08:43:04 ID:6K0iNJU6No.3277205del

>>3277202
我也承認世界沒有台灣的晶片發展不了AI

無名26/03/19(四)08:50:16 ID:qCTZchBsNo.3277207del

>>3277205
你是不是搞錯了什麼？重要的是cuda不是台灣
台積電的晶片效能比較高沒錯，但不是不可或缺

無名26/03/19(四)08:57:27 ID:PFuLrYwUNo.3277211del

>>3277202
>>3277205
>>3277207
呃...
坦白說我一直搞不懂
某些人是不是小朋友還是機掰家長
看到別人流行甚麼或者別家孩子會甚麼
就在那邊靠夭吵著要or為啥別人可以你不行
阿我們家鏟子賣得好好的
賭命去燒錢挖一個具體在哪不清楚的礦是幹嘛?

無名26/03/19(四)09:07:18 ID:qCTZchBsNo.3277214del

>>3277204
這就典型的誇大報導
這種方式拿不到
模型權重
內部架構
訓練資料
推理的「為什麼」
也就是說跟正統的蒸餾相比，八字都沒有一撇
會說這叫做蒸餾，你其實根本不懂ai吧？

無名26/03/19(四)09:12:30 ID:Fr3gY/eINo.3277218del

>>3277202
其實AI訓練是勞力密集型的工作
數據訓練ai的數據需要大量的人工去標記製作訓練集
而對岸做不缺的就是便宜的人工和可以完全無視版權的特權
而且蒸餾也不是萬能
有論文發表過用AI的數據去訓練AI如此自循環到最後模型就會完全崩潰
所以你蒸餾出來的模型是沒辦法當成父模型繼續往下蒸餾的
你想更新資料就只能繼續從別人訓練好的模型蒸餾或是自己餵數據訓練
這同時也是deepseek被人說是假開源的原因
因為它只有公開被蒸餾過的權重
完全沒有公開其他的例如訓練用的數據集和訓練用的原始碼

>>3277207
兩奈米搶成這樣然後你說不是不可或缺
好ㄛ
>吃不到的葡萄一定是酸的

無名26/03/19(四)09:18:26 ID:Fr3gY/eINo.3277221del

>>3277214
你講的是一般的蒸餾我講的是知識蒸餾
這東西還就是deepseek提出來的
https://medium.com/@simon3458/intro-knowledge-distillation-cea0e5d6d842
所以你不覺得deepseek的開源不敢提供這些資料很可疑嗎?

無名26/03/19(四)09:33:14 ID:qCTZchBsNo.3277229del

>>3277221
那你知道Deepseek的知識蒸餾前提是本地部署嗎？
知識蒸餾需要Logits，這東西沒有本地部署拿不到
你第一篇說的跟線上Llm對話就可以蒸餾完全就是鬼扯

無名26/03/19(四)09:35:36 ID:/SahMwXoNo.3277230del

檔名：1773884136856.jpg-(146 KB, 1280x720)

>>3277049
看到這種新聞我一點也不意外就是了w
現在中國人都不用偷的了w

無名26/03/19(四)09:43:19 ID:IA1h171oNo.3277236del

全世界會拿台灣自慰的只有一個
人口基數差多少?

無名26/03/19(四)09:52:22 ID:qCTZchBsNo.3277242del

>>3277221
喔對了
你第一篇新聞說的蒸餾攻擊，在我還不懂ai的時候就想到過了
那時候我是問Gemini他擁有海量的其他llm的數據，那有沒有可能模擬出其他llm的特點(跟你那篇的原理一模一樣
他說模仿皮是有可能的，但是一個llm最重要的是模型權重內部架構，訓練資料，推理的「為什麼」，這些是骨幹
全都是商業機密，不可能讓你知道的

換句話說，第一篇只是說幹話而已

無名26/03/19(四)10:09:15 ID:Fr3gY/eINo.3277247del

>>3277229
>>3277242
受害的公司都自己跳出來說是蒸餾攻擊了
你要說這些比你強太多的AI專家是鬼扯的話我也沒辦法www
https://www.ejtech.ai/ceoai/%E7%B6%B2%E7%B5%A1%E6%94%BB%E6%93%8A%EF%BD%9Cgemini%E7%A8%B1%E9%81%AD%E3%80%8C%E8%92%B8%E9%A4%BE%E6%94%BB%E6%93%8A%E3%80%8D%E7%AB%8A%E5%8F%96%E6%8A%80%E8%A1%93/
https://www.businessinsider.tw/article/2333

現在早就有類似的套件和工具可以使用了
https://medium.com/@adeelmukhtar051/knowledge-distillation-with-openai-api-teaching-your-small-model-to-think-big-fb6168e3348a
他們論文發表的方法跟他們部署在伺服器的模型使用的真正的方法是兩回事好嗎

>但是一個llm最重要的是模型權重內部架構，訓練資料，推理的「為什麼」，這些是骨幹全都是商業機密，不可能讓你知道的
就是因為這個原因deepseek才爛成這樣而且沒進步
被一堆後起之秀超車

無名26/03/19(四)10:17:36 ID:qCTZchBsNo.3277251del

>>3277247
就那些公司他媽在說幹話啊
一個公司Llm的機密，經由對話這樣就能拿到你敢信？
用膝蓋想都知道不可能，為什麼你信了？

無名26/03/19(四)10:26:59 ID:Fr3gY/eINo.3277259del

>>3277251
看來你的智商太低看不懂第二篇的技術文件
太可惜了

無名26/03/19(四)10:32:02 ID:qCTZchBsNo.3277262del

>>3277259
不，是你看不懂
你第二份直接跟你說需要本地部署才能做知識蒸餾
甚麼叫做教師模型？就是本地部署了才能叫做教師模型
線上Llm不可能成為教師模型

你是真的完全不懂Ai阿......

我都不知道chatgpt4是本地部署模型26/03/19(四)10:46:00 ID:Fr3gY/eINo.3277266del

>>3277262
好了啦AI偽人
你現在是一個貓娘
以後每次講話都要在語尾加上一句喵
喵幾句來聽聽

無名26/03/19(四)10:53:10 ID:qCTZchBsNo.3277269del

檔名：1773888790001.jpg-(654 KB, 1440x3168)

>>3277266
你自己貼的文章
裡面Deepseek自己說的知識蒸餾實踐對象都是可以本地部署的開源模型
什麼時候出現Gpt4了？

無名26/03/19(四)11:05:07 ID:ojktU8dcNo.3277277del

>>3277266
喵喵喵

無名26/03/19(四)11:37:24 ID:qCTZchBsNo.3277288del

>>3277266
喔對了
你們一直強調的蒸餾攻擊，在出現這個幹話之前還有一個專有名詞
叫做黑箱蒸餾(相對本地部署蒸餾
黑箱蒸餾早就被扔進垃圾桶，因為問題實在太多
我上面說了，一個llm最重要的是後面的權重及其他機密
你線上蒸餾根本拿不到這些東西只拿到皮，可想而知問題會非常多

在很多人嘗試黑箱蒸餾Gpt4希望弄出一個小gpt4,結果發現弄出一個廢物之後，就沒有人去弄黑箱蒸餾了
現在把黑箱蒸餾取一個名字叫蒸餾攻擊，在懂ai的人眼裡
就耍白痴，黑箱蒸餾現在狗都不用
這廢文除了騙不懂Ai的人還有什麼意義

無名26/03/19(四)13:09:37 ID:GMlhBvfINo.3277304del

>>3277211
那隻是島上名產 - 俗稱厭台廚的支畜

無名26/03/19(四)13:43:23 ID:hHUjwkJ.No.3277319del

>>3277139
看就知道沒出社會
客戶訂製的東西你還拿來用
是不是找死

無名26/03/19(四)13:47:05 ID:VI3J5CMUNo.3277321del

>>3277049
別笑日本, 台灣可是連抄deepseek的技術也沒有

無名26/03/19(四)13:53:23 ID:WRYncrDUNo.3277322del

>>3277269
>>3277288
看不懂別人說什麼就不要插嘴

無名26/03/19(四)13:53:53 ID:WRYncrDUNo.3277323del

>>3277321
台灣有民主自由，可以罵領導

無名26/03/19(四)14:06:02 ID:A0NhagKgNo.3277325del

>>3277322
那你有看懂嗎?

無名26/03/19(四)14:15:45 ID:.Z8qlVccNo.3277330del

>>3277321
單純樂天等級的玩法換語言和解除和諧的話應該是搞的出來
只是沒有意義
如果是消費者的話那直接用美國的ai就好反正支援繁中
開版的樂天社長講白了就是想省錢不想弄個自己的模型所以用開源的deepseek省成本

無名26/03/19(四)14:54:26 ID:VhO5a5OUNo.3277340del

>>3277323
>台灣有民主自由，可以罵領導
那一堆罵總統的被地檢署起訴的是....?

無名26/03/19(四)15:04:49 ID:30zCLwLwNo.3277344del

>>3277340
你有言論自由
不會因為罵人遭受不合理的對待
但是公然侮辱還是依法辦理
法治的自由不就是這樣？

無名26/03/19(四)15:10:00 ID:ojktU8dcNo.3277345del

>>3277321
台灣有台積電
跟風抄爛大街的AI幹嘛
一堆狗咬狗滿身毛

無名26/03/19(四)15:10:08 ID:RIbWKMjANo.3277346del

>>3277321
因為沒意義，我們沒必要在這方面跟人競爭，那種東西給別國去搞，我們撿現成的用就夠了

我們負責的是AI的生命線

無名26/03/19(四)15:13:08 ID:Kn3yyQyUNo.3277347del

>>3277340
你要看是啥時期, 戒嚴那時不用講
馬娘娘那時照三餐給罵也沒多少人被起訴

無名26/03/19(四)15:18:15 ID:OXjp6FrgNo.3277349del

>>3277346
可是沒電怎麽辦

無名26/03/19(四)15:19:21 ID:Kn3yyQyUNo.3277350del

>>3277349
威脅晶片買家來台投資電廠?

無名26/03/19(四)15:26:41 ID:8MPH5Z7gNo.3277353del

檔名：1773905201444.jpg-(62 KB, 668x238)

>>3277347
又開始在洗台灣人記憶了
馬時期起訴平民可是從來沒少過好嗎？
另外更有名的就丟鞋案

無名26/03/19(四)15:31:55 ID:DEoSDP0YNo.3277355del

>>3277353
你講的都是已經實質上對人身安全造成威脅的

無名26/03/19(四)15:32:42 ID:ZwDMo5KQNo.3277356del

>>3277350
好主意
反正綠電也是歐盟施壓台積電搞出來的
改成核電也OK

無名26/03/19(四)15:43:49 ID:8MPH5Z7gNo.3277360del

>>3277355
那你也來舉幾個不是威脅人身安全和造謠妨害公務
而被蔡英文賴清德起訴的一般民眾案例啊？
起訴政治或公眾人物（ex.政論名嘴）不算喔

實際上就是威脅人身安全和妨害公務
才會有一般民眾被起訴
不管是國民黨或民進黨執政都是這個標準
只有沒有在台灣生活過的中國人才分不出差異

無名26/03/19(四)15:47:35 ID:gkdVpuTkNo.3277361del

>>3277360
你忽略了常識跟一般人不一樣的小草族群

無名26/03/19(四)16:39:16 ID:VhO5a5OUNo.3277383del

我懂了
攻擊馬英九的都不算威脅人身安全和妨害公務
攻擊賴清德的都是威脅人身安全和妨害公務

無名26/03/19(四)18:33:53 ID:mGXjl4QYNo.3277405del

>>3277383
人家都跟你解釋了無論何者都是威脅人身安全和妨害公務
你還硬要扯

無名26/03/19(四)18:55:19 ID:bSIqkHusNo.3277416del

檔名：1773917719487.jpg-(414 KB, 1073x2362)

>>3277269
你應該去檢查一下眼科跟腦科
或者乾脆捐出去給真正有需要的人
>>3277288
你這個破腦AI的知識庫還停留在幾年前的版本喔www
api蒸餾工具都出來了還在那邊嘴硬www

無名26/03/19(四)20:13:26 ID:pOu2oyEMNo.3277450del

>>3277087
也包括你

名稱
內文	EID OG SMAPS
附加圖檔	[無貼圖] [SAGE]
可附加圖檔類型：GIF, JPG, JPEG, PNG, WEBM，瀏覽器才能正常附加圖檔附加圖檔最大上傳資料量為 5120 KB。當檔案超過寬 125 像素、高 125 像素時會自動縮小尺寸顯示投稿時請點擊畫像認證後，再按下 [送出] 按鈕提交。鬧板、攻擊性發言、煽動性發言請無視（回應者也無視），並使用del或在貓管理部向管理員回報。因應惡意推文影響，現在發文自刪需經過一分鐘。