[
回首頁
] [
搜尋
] [
檔案區
] [
管理區
] [
重新整理
]
預設
夜間
男性角色
[
回到版面
]
回應模式
名 稱
內 文
EID OG SMAPS
附加圖檔
[
無貼圖
] [
SAGE
]
可附加圖檔類型:GIF, JPG, JPEG, PNG, WEBM,瀏覽器才能正常附加圖檔
附加圖檔最大上傳資料量為 5120 KB。
當檔案超過寬 125 像素、高 125 像素時會自動縮小尺寸顯示
投稿時請點擊畫像認證後,再按下 [送出] 按鈕提交。
鬧板、攻擊性發言、煽動性發言請無視(回應者也無視),並使用del或在貓管理部向管理員回報。
因應惡意推文影響,現在發文自刪需經過一分鐘。
檔名:
1773842099463.jpg
-(4 KB, 300x168)
三木谷浩史(樂天社長)
無名
26/03/18(三)21:54:59 ID:Laorex2U
No.3277049
del
自稱要打造日本最強ai
最後搞了2年多的ai戰略端出來的成果就是抄襲
抄襲就算了還抄中國的deepseek實際上樂天自己只做了日文化界面和反和諧而已本質上還是deepseek
樂天ai的推特評論區一半是暴怒的日本網右大罵樂天賣國幫中國偷資料
剩下一半是來特地來嘲諷的中國人
無名
26/03/18(三)22:10:05 ID:XeiFDtDA
No.3277053
del
那些吵的網民很多根本沒搞清楚狀況
RakutenAI是完全開源,真的是deepseek換皮他開源給人看做什麼?
而且deepseek沒真開源,RakutenAI是要怎麼拿來換皮?
無名
26/03/18(三)22:30:56 ID:.rziUVkA
No.3277061
del
>>3277049
重點不是用哪國貨
是樂天要做本國llm求政府補助
補助款下來成品竟然是外國貨換皮
這不管在哪國都是妥妥的詐欺+背信
無名
26/03/18(三)23:16:55 ID:rlHk8y4s
No.3277086
del
>>3277053
Deepseek是真開源,不然你以為他去年突然爆紅是為什麼
>>3277061
沒,日本政府給的預算本來就是叫樂天在開源模型上建立自己的ai
你可以去看看Geniac計畫,日本政府給的預算不可能自建一個全新的大模型
甚至拿開源的Deepseekv3重新訓練都沒辦法,成本太高了
樂天的做法是唯一可行的做法,他唯一的錯就是說日本的ai
至於什麼偷資料就是外行人說幹話了
無名
26/03/18(三)23:18:32 ID:F6loK6xk
No.3277087
del
>>3277086
有很多人蠢到會把個人資料上傳給AI平台的
不騙
無名
26/03/18(三)23:19:40 ID:rlHk8y4s
No.3277089
del
>>3277087
開源就是叫你下載下來建立本地模型,你是要上傳甚麼?
路過的AI工程師
26/03/18(三)23:28:29 ID:pcZ1202g
No.3277093
del
>>3277089
你以為人人都有100多G顯存可以隨便跑大型LLM啊
不要拿量化模型說嘴
Q8以下的模型都是語障+腦殘
連最基本的指令都做不好
無名
26/03/18(三)23:30:17 ID:rlHk8y4s
No.3277095
del
目前開源模型最強就是deepseek,而且完全開放授權使用
日本如果想要自己訓練一個Llm,沒有個3萬張h100是做不到的,還不一定會成功,美國的ai人才有一半都是華裔,日本?
算了,還是別浪費時間金錢吧
無名
26/03/18(三)23:31:26 ID:rlHk8y4s
No.3277097
del
>>3277093
樂天這種等級當然是直接下載完整的Deepseek作本地部署啊
無名
26/03/18(三)23:35:07 ID:XeiFDtDA
No.3277099
del
>>3277086
>Deepseek是真開源,不然你以為他去年突然爆紅是為什麼
就不是,他是假開源這個當初就吵過了
https://huggingface.co/Rakuten/RakutenAI-3.0
Deepseek可沒樂天這樣
無名
26/03/18(三)23:42:07 ID:rlHk8y4s
No.3277105
del
>>3277099
都公開權重,可本地部署,可以商業使用,允許微調後散佈
做到這種程度還不叫開源,我不知道什麼才叫開源了
無名
26/03/18(三)23:44:42 ID:pcZ1202g
No.3277106
del
>>3277095
>目前開源模型最強就是deepseek,而且完全開放授權使用
早就被打爆了好嗎 老外論壇都是在用qwen
寫程式和解數學問題的能力還遠弱於minimax等其他模型
而其他比deepseek弱的模型都有多模態的視覺能力了 就你還沒有
你不懂目前AI生態就別來亂吹了吧
>>3277097
部署在他們本地不就代表使用者還是上傳資料給他們的伺服器進行運算?
無名
26/03/18(三)23:46:05 ID:pcZ1202g
No.3277108
del
>>3277105
開源的是蒸餾過的弱化版
掛在他們伺服器上運作的那一版沒有開源
其實就跟openai一樣罷了
無名
26/03/18(三)23:51:02 ID:rlHk8y4s
No.3277113
del
>>3277106
部署在樂天的伺服器,為什麼會是幫中國偷資料?懂?
無名
26/03/18(三)23:57:41 ID:pcZ1202g
No.3277119
del
>>3277113
>有很多人蠢到會把個人資料上傳給AI平台的
我是附和這句話
幫中國偷資料又不是我說的
無名
26/03/18(三)23:59:48 ID:rlHk8y4s
No.3277120
del
>>3277119
原話是幫中國偷資料
問題是樂天自己本地部署不可能發生這種事
無名
26/03/19(四)00:05:23 ID:VYDfUQXA
No.3277121
del
>>3277120
干我屁事
我只要證明我附和的論點是正確的就夠了
無名
26/03/19(四)00:05:24 ID:vCqRITfQ
No.3277122
del
>>3277105
就跟你講當初吵過了所以才講假開源
真開源去看樂天那個網址,那個才叫真開源
deepseek相比之下頂多只能算開放素材,開放的還沒騰訊混元多呢
無名
26/03/19(四)00:14:47 ID:9s4vHcIY
No.3277127
del
>>3277061
>補助款下來成品竟然是外國貨換皮
>這不管在哪國都是妥妥的詐欺+背信
正常國家的話啦
無名
26/03/19(四)00:42:56 ID:8xbgmj7o
No.3277139
del
>>3277049
日本就算了, 台灣明明是全世界最不缺晶片的地方, 竟然連一個deepseek級數的大模型也生不出來
無名
26/03/19(四)01:03:28 ID:7DTldojw
No.3277149
del
>>3277139
因為你是個智障才會覺得做石油公司一定也是全球最大的成衣製造商
然後deepseek這玩意兒早就被看破是堆錢+蒸別人的數據搞出來的玩意兒,真的要做AI也不是做成你deepseek這種鬼玩意兒
無名
26/03/19(四)05:32:51 ID:i/AqQr5c
No.3277169
del
>>3277149
對對對
吃不到的葡萄一定是酸的
無名
26/03/19(四)05:37:18 ID:DAN.DC56
No.3277170
del
上次不是才有中國官員被openai發現用他們的東西搞網軍戰術,所以為何不用自己的deepseek?
無名
26/03/19(四)05:42:19 ID:ADZyCMdM
No.3277171
del
>>3277139
>>台灣明明是全世界最不缺晶片的地方
因為那堆晶片都是國外訂單
台灣不能拿來自用
無名
26/03/19(四)05:58:11 ID:JoDm4M5Y
No.3277173
del
>>3277169
葡萄酸就酸啊,反正賣葡萄的錢有收到就好
無名
26/03/19(四)07:33:06 ID:qCTZchBs
No.3277183
del
>>3277149
哪來的智障
Ai本來就是極度燒錢的東西
蒸別人的數據更搞笑,ai本來就是到處拿人的數據來用,沒有例外
Claude還因此吃官司
無名
26/03/19(四)07:40:34 ID:mRnrPSrk
No.3277188
del
>>3277139
台灣是用在工業製造了
向台積那些和NV合作的公司,不相信沒有
無名
26/03/19(四)08:15:15 ID:qCTZchBs
No.3277194
del
>>3277188
Ai是軟體
晶片是鏟子,兩個根本沒關系就是
無名
26/03/19(四)08:36:22 ID:SfYjICEA
No.3277202
del
承認吧 台灣就是連抄AI數據能力的人才都沒有
無名
26/03/19(四)08:42:18 ID:kBF/9yQU
No.3277204
del
>>3277183
蒸餾攻擊了解一下
https://techorange.com/2026/02/13/google-gemini-distillation-attacks/
訓練和直接用模型蒸餾是兩件事
找資料訓練你還要花時間做訓練集 手工標記大量資料
還要做資料清洗 最後才變成可以丟給AI訓練的狀態
AI最花錢費工的部分其實也是在這邊
你直接用別人的模型蒸餾就等於是跳過這過程
沒有別人辛苦花成本弄出來的基礎模型 你什麼屁都蒸餾不出來
還有這已經不只是盜數據的問題了
實際是連算力也一起盜
記得之前還有白癡信勢旦旦地說線上部署的模型沒辦法蒸餾
現在人家直接貼數據給你看了www
無名
26/03/19(四)08:43:04 ID:6K0iNJU6
No.3277205
del
>>3277202
我也承認世界沒有台灣的晶片發展不了AI
無名
26/03/19(四)08:50:16 ID:qCTZchBs
No.3277207
del
>>3277205
你是不是搞錯了什麼?重要的是cuda不是台灣
台積電的晶片效能比較高沒錯,但不是不可或缺
無名
26/03/19(四)08:57:27 ID:PFuLrYwU
No.3277211
del
>>3277202
>>3277205
>>3277207
呃...
坦白說我一直搞不懂
某些人是不是小朋友還是機掰家長
看到別人流行甚麼或者別家孩子會甚麼
就在那邊靠夭吵著要or為啥別人可以你不行
阿我們家鏟子賣得好好的
賭命去燒錢挖一個具體在哪不清楚的礦是幹嘛?
無名
26/03/19(四)09:07:18 ID:qCTZchBs
No.3277214
del
>>3277204
這就典型的誇大報導
這種方式拿不到
模型權重
內部架構
訓練資料
推理的「為什麼」
也就是說跟正統的蒸餾相比,八字都沒有一撇
會說這叫做蒸餾,你其實根本不懂ai吧?
無名
26/03/19(四)09:12:30 ID:Fr3gY/eI
No.3277218
del
>>3277202
其實AI訓練是勞力密集型的工作
數據訓練ai的數據需要大量的人工去標記製作訓練集
而對岸做不缺的就是便宜的人工和可以完全無視版權的特權
而且蒸餾也不是萬能
有論文發表過 用AI的數據去訓練AI如此自循環到最後模型就會完全崩潰
所以你蒸餾出來的模型是沒辦法當成父模型繼續往下蒸餾的
你想更新資料就只能繼續從別人訓練好的模型蒸餾或是自己餵數據訓練
這同時也是deepseek被人說是假開源的原因
因為它只有公開被蒸餾過的權重
完全沒有公開其他的例如訓練用的數據集和訓練用的原始碼
>>3277207
兩奈米搶成這樣 然後你說不是不可或缺
好ㄛ
>吃不到的葡萄一定是酸的
無名
26/03/19(四)09:18:26 ID:Fr3gY/eI
No.3277221
del
>>3277214
你講的是一般的蒸餾 我講的是知識蒸餾
這東西還就是deepseek提出來的
https://medium.com/@simon3458/intro-knowledge-distillation-cea0e5d6d842
所以你不覺得deepseek的開源不敢提供這些資料很可疑嗎?
無名
26/03/19(四)09:33:14 ID:qCTZchBs
No.3277229
del
>>3277221
那你知道Deepseek的知識蒸餾前提是本地部署嗎?
知識蒸餾需要Logits,這東西沒有本地部署拿不到
你第一篇說的跟線上Llm對話就可以蒸餾完全就是鬼扯
無名
26/03/19(四)09:35:36 ID:/SahMwXo
No.3277230
del
檔名:
1773884136856.jpg
-(146 KB, 1280x720)
>>3277049
看到這種新聞我一點也不意外就是了w
現在中國人都不用偷的了w
無名
26/03/19(四)09:43:19 ID:IA1h171o
No.3277236
del
全世界會拿台灣自慰的只有一個
人口基數差多少?
無名
26/03/19(四)09:52:22 ID:qCTZchBs
No.3277242
del
>>3277221
喔對了
你第一篇新聞說的蒸餾攻擊,在我還不懂ai的時候就想到過了
那時候我是問Gemini他擁有海量的其他llm的數據,那有沒有可能模擬出其他llm的特點(跟你那篇的原理一模一樣
他說模仿皮是有可能的,但是一個llm最重要的是模型權重內部架構,訓練資料,推理的「為什麼」,這些是骨幹
全都是商業機密,不可能讓你知道的
換句話說,第一篇只是說幹話而已
無名
26/03/19(四)10:09:15 ID:Fr3gY/eI
No.3277247
del
>>3277229
>>3277242
受害的公司都自己跳出來說是蒸餾攻擊了
你要說這些比你強太多的AI專家是鬼扯的話我也沒辦法www
https://www.ejtech.ai/ceoai/%E7%B6%B2%E7%B5%A1%E6%94%BB%E6%93%8A%EF%BD%9Cgemini%E7%A8%B1%E9%81%AD%E3%80%8C%E8%92%B8%E9%A4%BE%E6%94%BB%E6%93%8A%E3%80%8D%E7%AB%8A%E5%8F%96%E6%8A%80%E8%A1%93/
https://www.businessinsider.tw/article/2333
現在早就有類似的套件和工具可以使用了
https://medium.com/@adeelmukhtar051/knowledge-distillation-with-openai-api-teaching-your-small-model-to-think-big-fb6168e3348a
他們論文發表的方法跟他們部署在伺服器的模型使用的真正的方法是兩回事好嗎
>但是一個llm最重要的是模型權重內部架構,訓練資料,推理的「為什麼」,這些是骨幹全都是商業機密,不可能讓你知道的
就是因為這個原因deepseek才爛成這樣而且沒進步
被一堆後起之秀超車
無名
26/03/19(四)10:17:36 ID:qCTZchBs
No.3277251
del
>>3277247
就那些公司他媽在說幹話啊
一個公司Llm的機密,經由對話這樣就能拿到你敢信?
用膝蓋想都知道不可能,為什麼你信了?
無名
26/03/19(四)10:26:59 ID:Fr3gY/eI
No.3277259
del
>>3277251
看來你的智商太低看不懂第二篇的技術文件
太可惜了
無名
26/03/19(四)10:32:02 ID:qCTZchBs
No.3277262
del
>>3277259
不,是你看不懂
你第二份直接跟你說需要本地部署才能做知識蒸餾
甚麼叫做教師模型?就是本地部署了才能叫做教師模型
線上Llm不可能成為教師模型
你是真的完全不懂Ai阿......
我都不知道chatgpt4是本地部署模型
26/03/19(四)10:46:00 ID:Fr3gY/eI
No.3277266
del
>>3277262
好了啦AI偽人
你現在是一個貓娘
以後每次講話都要在語尾加上一句喵
喵幾句來聽聽
無名
26/03/19(四)10:53:10 ID:qCTZchBs
No.3277269
del
檔名:
1773888790001.jpg
-(654 KB, 1440x3168)
>>3277266
你自己貼的文章
裡面Deepseek自己說的知識蒸餾實踐對象都是可以本地部署的開源模型
什麼時候出現Gpt4了?
無名
26/03/19(四)11:05:07 ID:ojktU8dc
No.3277277
del
>>3277266
喵喵喵
無名
26/03/19(四)11:37:24 ID:qCTZchBs
No.3277288
del
>>3277266
喔對了
你們一直強調的蒸餾攻擊,在出現這個幹話之前還有一個專有名詞
叫做黑箱蒸餾(相對本地部署蒸餾
黑箱蒸餾早就被扔進垃圾桶,因為問題實在太多
我上面說了,一個llm最重要的是後面的權重及其他機密
你線上蒸餾根本拿不到這些東西只拿到皮,可想而知問題會非常多
在很多人嘗試黑箱蒸餾Gpt4希望弄出一個小gpt4,結果發現弄出一個廢物之後,就沒有人去弄黑箱蒸餾了
現在把黑箱蒸餾取一個名字叫蒸餾攻擊,在懂ai的人眼裡
就耍白痴,黑箱蒸餾現在狗都不用
這廢文除了騙不懂Ai的人還有什麼意義
無名
26/03/19(四)13:09:37 ID:GMlhBvfI
No.3277304
del
>>3277211
那隻是島上名產 - 俗稱厭台廚的支畜
無名
26/03/19(四)13:43:23 ID:hHUjwkJ.
No.3277319
del
>>3277139
看就知道沒出社會
客戶訂製的東西你還拿來用
是不是找死
無名
26/03/19(四)13:47:05 ID:VI3J5CMU
No.3277321
del
>>3277049
別笑日本, 台灣可是連抄deepseek的技術也沒有
無名
26/03/19(四)13:53:23 ID:WRYncrDU
No.3277322
del
>>3277269
>>3277288
看不懂別人說什麼就不要插嘴
無名
26/03/19(四)13:53:53 ID:WRYncrDU
No.3277323
del
>>3277321
台灣有民主自由,可以罵領導
無名
26/03/19(四)14:06:02 ID:A0NhagKg
No.3277325
del
>>3277322
那你有看懂嗎?
無名
26/03/19(四)14:15:45 ID:.Z8qlVcc
No.3277330
del
>>3277321
單純樂天等級的玩法換語言和解除和諧的話應該是搞的出來
只是沒有意義
如果是消費者的話那直接用美國的ai就好反正支援繁中
開版的樂天社長講白了就是想省錢不想弄個自己的模型所以用開源的deepseek省成本
無名
26/03/19(四)14:54:26 ID:VhO5a5OU
No.3277340
del
>>3277323
>台灣有民主自由,可以罵領導
那一堆罵總統的被地檢署起訴的是....?
無名
26/03/19(四)15:04:49 ID:30zCLwLw
No.3277344
del
>>3277340
你有言論自由
不會因為罵人遭受不合理的對待
但是公然侮辱還是依法辦理
法治的自由不就是這樣?
無名
26/03/19(四)15:10:00 ID:ojktU8dc
No.3277345
del
>>3277321
台灣有台積電
跟風抄爛大街的AI幹嘛
一堆狗咬狗滿身毛
無名
26/03/19(四)15:10:08 ID:RIbWKMjA
No.3277346
del
>>3277321
因為沒意義,我們沒必要在這方面跟人競爭,那種東西給別國去搞,我們撿現成的用就夠了
我們負責的是AI的生命線
無名
26/03/19(四)15:13:08 ID:Kn3yyQyU
No.3277347
del
>>3277340
你要看是啥時期, 戒嚴那時不用講
馬娘娘那時照三餐給罵也沒多少人被起訴
無名
26/03/19(四)15:18:15 ID:OXjp6Frg
No.3277349
del
>>3277346
可是沒電怎麽辦
無名
26/03/19(四)15:19:21 ID:Kn3yyQyU
No.3277350
del
>>3277349
威脅晶片買家來台投資電廠?
無名
26/03/19(四)15:26:41 ID:8MPH5Z7g
No.3277353
del
檔名:
1773905201444.jpg
-(62 KB, 668x238)
>>3277347
又開始在洗台灣人記憶了
馬時期起訴平民可是從來沒少過好嗎?
另外更有名的就丟鞋案
無名
26/03/19(四)15:31:55 ID:DEoSDP0Y
No.3277355
del
>>3277353
你講的都是已經實質上對人身安全造成威脅的
無名
26/03/19(四)15:32:42 ID:ZwDMo5KQ
No.3277356
del
>>3277350
好主意
反正綠電也是歐盟施壓台積電搞出來的
改成核電也OK
無名
26/03/19(四)15:43:49 ID:8MPH5Z7g
No.3277360
del
>>3277355
那你也來舉幾個不是威脅人身安全和造謠妨害公務
而被蔡英文賴清德起訴的一般民眾案例啊?
起訴政治或公眾人物(ex.政論名嘴)不算喔
實際上就是威脅人身安全和妨害公務
才會有一般民眾被起訴
不管是國民黨或民進黨執政都是這個標準
只有沒有在台灣生活過的中國人才分不出差異
無名
26/03/19(四)15:47:35 ID:gkdVpuTk
No.3277361
del
>>3277360
你忽略了常識跟一般人不一樣的小草族群
無名
26/03/19(四)16:39:16 ID:VhO5a5OU
No.3277383
del
我懂了
攻擊馬英九的都不算威脅人身安全和妨害公務
攻擊賴清德的都是威脅人身安全和妨害公務
無名
26/03/19(四)18:33:53 ID:mGXjl4QY
No.3277405
del
>>3277383
人家都跟你解釋了無論何者都是威脅人身安全和妨害公務
你還硬要扯
無名
26/03/19(四)18:55:19 ID:bSIqkHus
No.3277416
del
檔名:
1773917719487.jpg
-(414 KB, 1073x2362)
>>3277269
你應該去檢查一下眼科跟腦科
或者乾脆捐出去給真正有需要的人
>>3277288
你這個破腦AI的知識庫還停留在幾年前的版本喔www
api蒸餾工具都出來了還在那邊嘴硬www
無名
26/03/19(四)20:13:26 ID:pOu2oyEM
No.3277450
del
>>3277087
也包括你
【刪除文章】[
僅刪除附加圖檔
]
刪除用密碼: