本字幕由TME AI技术生成 嗯嗯 大家好 这是一档没有大纲 没有草稿 没有剪辑的胡凯瞎聊得不嘚博客 我是理科生现在是AI补育师的塔塔 然后今天我们要聊的这个节目的话题的话 其实是那个从过年前就开始很热 一直热到现在完全没有消退的 就是关于deepsik以及由deepsk所带来的一些可能的一些好玩的想法吧 毕竟之前聊了两期 一期是讲历史的 一期是讲物理的 可能都偏严肃一点 当然其实还蛮好吧 没有那么严肃 但是后面一期一个多小时将近两个小时的讲物理的 的确是有点严肃了点 那今天就找点轻松的话题来来聊 deepCK这东西的话 其实我一直在用 我大概是从那个deepc壳二还没有出的时候的话 因为我们团队的话 是一开始在那段时间的话 在做跟AI安全相关的 就是说市面上的所有的AI的东西 我们这边其实都有跟他们去对接 去使用 会提很多的一些修改意见 比如说不管是GPT还是cloud 还是jermy 他们早面会有很多安全方面的 就是所谓的那个提示语越狱的一些方案 我们这边的话 有想到很多那个越狱的一些方案 并且把它给越狱越的还挺成功的 所以说那个时候的话 包括那个国内的GRM deepseek 还有算是豆包通用纤温的话 我们都有接过来去测 呃 反正从那时候就开始用了 然后的话 一直到那个v奥的时候的话 就感觉这个东西的话 在国内算是可以站在第一梯队的了 然后在那个时候v奥的时候的话 我们自己试下来的话 个人感觉到 基本上是kimi和deepsick大概是一档 后面的话 可能就是像是豆包也是 豆包用的是火山模型嘛 他们可能和自豪 至少我感觉还是有一定差距的 然后v三出来之后的话 包括v三和r一基本上是差不多时候出来的嘛 用了一下的话 就感觉的确它现在这种是在国内肯定是属于是第一档的 嗯 而且第一档应该就他这一个了 整个的一个思路的话 是相当OK的 当然了 这里面的话 大家被阿姨给呃惊艳到 然后我这边的话 其实因为它里面用的一些方案 我们是就是我这边的话 做提取过程比较多 因为直接做大模型的话 我们这边没有这么多显卡去做 所以说在大模型这边的话 我们想了一些方案 比如说我们会把所谓的思考思路的环节 跟最后根据思路去进行一个实际的思考这个环节强行给拆分开 拆分完之后的话 基本上包括国内的很多大模型在内的话 它的一个质量都可以有一定的提升的 虽然说的话 不可能有质的飞跃 但是在量的飞跃上也有 所以说在看到r一的他一个情况的时候的话 其实我们第一个反应就是说 他是在v三的基础上面用这套方案去做 但后来看到一个论文的话 应该并不是只是这样子 因此也是说 只是做提示语工程的话 跟从那个底层的角度来做 肯定是有很大的一个差别的 不管是质上面 量上面的话 都是有很大的一个差别在的 那对对 下面要说的是 就是关于那个deepsick的话 我们用下来 它的确是很好 但是还没有好到说是那个全球主霸天下这个程度 至少从我的感觉上来看的话 并没有 从一些那个 就是他们公开出来这些测评结果 包括我们自己的一个测评结果的话 综合实力上来看的话 因为这个其实就跟大家谈智商一样的 把所有都是约化为一个指标 其实是很不科学的 所以它要分为很多类嘛 因此它跟包括那个GPT 然后GPT的四o和o一 那主要OOE啊 因为四o基本上现在已经至少在我们内部的话 已经把四o排除在第一梯队队了 第一梯队的话 我们基本看的话 只有OE cloud的那个sudneit三点五 还有是那个gernei二点零 就flflash二点零 还有这三个 基本上是在我们内部用的话 是把它第一梯队去用的 然后的话 grouk二 嗯 就是稍微差一点 呃 grouk二其实它还有一些其他的问题 它的所谓的安全控制上面的话 其实可以说是几乎没有 这个的话 很做一些 你不管像是我前公司那边想做擦边的 还是说做一些赌博的 欺骗的 欺诈的 其实的话 你用girk二原则上的话都可以用的 比有别的东西是要好很多 同样的 你像那个擦边的 或者说欺诈的一些东西的话 OE用cloud 用germany的话 可能要用点小技巧才可以让它产生一些会有危害性的内容 但是在girk二里面的话 相对而言 不需要很多的技巧就可以把它给做出来的 然后的话 至少在我们之前的话 第一梯队的话 主要是这三个 然后现在的话 那个就是deepseek的v三和r一出来之后的话 r一基本上进到第一梯队是没问题的 那进到的第一梯的话 现在有四个了 然后是v三和glk二的话 是在第二梯队里面 它在第一梯队里面的话 其实也是有一定的 就是大家各自有各体的各自的长处吧 就比如说在deepsik之前的话 写文章我基本上肯定是要那个sennet三点五去做的 那个时候的话 我想看我写文章用的是三点五 然后让它去生成斯诺用的一个所谓的那个chip的一个乐谱 用的也是snet三点五 基本上都有使用它 深度推理的话 然后用我们自己的一套继续工程的话 smilnet其实也是比别的公程是要好 你像那个flash 呃 那个germal的flash二点零有一个什么thinking这个一个版本 那个版本的话 其实它的思路就跟OE相对于v三的思路是一样的 他把整个这个东西的话 在底层就让它怎么去思考的过程给给单列出来了 国用的很多朋友因为是用不了germana 所以说并不清楚 所以说在我们看到一和v三的时候的话 就会理解成r一相对于v三 就等于是节MIflash二点零的thinking模式跟一个非thinking模式之间的一个区别 所以说当时看到的话 并没有过于惊艳 然后从功能上来说的话 你比如说我们在那个就是去测试一个AI模型 它一个所的常推理的一个情况 所谓常推的话 就是从你的一个出发点到你的一个结论之间的一个逻辑链条是很长的 中间可能还会有一些弯弯绕绕一个最经典的一个题目的话 我们这边有两道比较简单的一道经典题目的话 是我们把一个就是石头剪刀布这个游戏里面增加了怪 怪这么一个角 角色 从而有四个身份 它在正常的石头剪刀布的规则之之下的话 增加了两条 一个是石头剪刀布打怪 就是任 任何牌去攻 攻击 肯定是攻 攻方赢 赢 怪攻 攻击任何牌 牌 可也肯定是怪赢 换言之 就是进攻去这个游戏门 它分为是进攻 攻和那个防守守方 你比如说 石头打怪 是石头赢 怪打石头 是怪赢 增加了这么一个就是所谓的 呃 怪相关的一个攻防规则之后的话 然后我告诉他 比如说甲进攻乙是输了 乙进攻甲是输 输了 甲进攻丙是赢了 丙进攻乙是赢了 那么请问丙是什么牌 嗯 或者说 能不能把场上甲乙丙三个n个人的牌头给分析推理出来 这是我们只是内部所用的 就是两套题目中的一个比较简单的一套题 当然还有一些别的题啊 当然这两道是最近最经典的 就说是拿过来的模型 我们基本上这两个问题都会用别的一些模型 未必所有东西都都会用 那我就先说这两个好了 那这个的话 其实我们作为一个人类的话 去分析的话 在已知所有的攻防规则情况下的话 那是其实很简单嘛 你通过甲能够答乙输了 乙能够答甲 乙输了 要证明甲跟乙的身份 其实他们的就出的东西是一样的 并且都不不 不是怪 就是说 两个要么同为石头 同为剪刀 或者同为尾布 但是不可能同为怪 对吧 这是一个很容易推导出来的 然后再根据这个结果 你去看后面的话 比如说甲攻击丙是赢了 丙攻击乙是赢了 从这个规则就可以推断出 丙肯定是怪 OK 那我们就知道了 甲跟乙的身份相同 且都不是怪 以及丙是怪 这个结论就推导出来了 但这个东西的话 此前推理成功的只有o一和soneate三点五 别的的所有模型全部推理失败 而且是o一在推理的时候的话 用英文问 它是可以推理成功的 用中文问它 它 它是推理是失败的 然后在v三 v三 它是那个推理成功 OR一同样是推理成成功 而且从这个角度来看 长推理的话 至少这第一关中的话 OK 它跟相当于说v三和r一是跟senneate三点五 以及跟那个o一 它是处于同一档的 简单查一下这个里面的话 它都没有是完全推理成功 这是第一道题 第二道题的话 是一个数学上的一个问题 它同样是考验的是常推理 就比如说 呃 我让你证明cosine七度并不是弧度 是角度啊 cosine七度是个无理数 用的是只能用初中的数学知识去证明它 初中数学知识的话 就是包括了比如说那个 那个 那个叫什么么和化积计划 和差 倍角 倍角公式 三倍角公式 周期公式 反反射公式 就只有这几个 没有很多了 因为如果说你再加入更多的一些东西的话 它就其实就不再只是一个初中的一个数学了 你比如说我们把那个大学的数学放进去的话 那它其实就是一个已知的定定理 那定理的话 你可以直接拿来用这问题就没有意义了嘛 你就考验不了它一个推推理了 所以说 我会去限定一个AI模型只能够在我上述所说的这些公式中去使用 那然后去看它的一个推理结果 你一定要把cos七度为无理数给推理出来 这道题出来的话 目前所有的AI模型都没有推理成功 因为它的逻辑链条是比较长的 比如说一个最经典的一个证明方式的话 它是这样子的 先利用那个两倍角公式 三倍角公式 我们可以证明的是七度的话 如果说七度它是个由就cosine七度是个游理数的话 那ss二十一度是个由理数 三倍角公公式嘛 再用这三倍角公式的话 cosine六十三度是个游理数 再用这三倍角公式的话 cos一百八十九度是有理数 利用周期公式的话 cos九度是有理数 cos九度如果说是有理数的话 那相当于说cosine十度度 二十七度 coscos四十 呃 cos就是那个十八度 二十七度也都是有理数 那样的话 假定我们在不知道cos十八度的角度是多少的情况下 那这东东西它是可以通过一些式算出来 如 如果你已经算出的话 那你实际上可以知道 它已经推导出来cosine十八度是个有理数 它是一个矛盾了 因为我们算出来cosine十八度它不是个有理数 OK 那假定你现在没有算出来的话 那继续往后乘 哎 也 也很简单 cos二十七度是有理数的话 那cosine八十度就是是理有有理数 cosine八十一度是有理数的话 那cosine九度就是有理数 cosine九度 sine九度都是有理数的情况下 那cosine九NN是整数的情况下 它都是有理数 那么cosine四十五度是有理数 但是我们知道 cosine四十五度 sine四十五度 它都是二分之根号 它不是是理数 而 而是个无理数 那整个逻辑链条的源头 也就是说cosine度是一个有理数 这个假设它就错错那七度它就是个无理理数 因此它是一个勒税比比较漫长的 相对来说 我们并不是直接去证明cos七度是一个无理数 而是说要去构建就是一个矛盾 在这个矛盾中的话 我们会用到一个中间结果 就是cosine九度它是不是有理数 利用利用它 相当于说要经过两步推理 然后的话 我们会发现 包括就是deepseek的一个v三和r一在内的话 大部分的或者说绝大部分的一个模型 它们的推理的话 都是先利用那个三倍角公式 然后得到了一个等式 在等式中的话 我们假定最后的结果是一个有理数 然后来推导出一个作为未知数的cos七度它是一个无无理数 但这个推理逻辑它还最大问题 问题是你看它建立的是cosine二十一度和cos七度之间的一个关关系 它从三倍角公式来得到的 但是cosine二十一度它是不是无理数呢 它并没有被证明啊 因此大家这里面所有的逻辑证明的话 其实这个出发点它其实就是不够坚定的 然后的话 表现比较好的 一个是sine三 sinenet三点五 一个是真爱的flash二点零 这两个的话 他是想到了一个中间结果 就是去证明cosine九度到底是不是一个无理数 但是的话 他们到了这一步之后的话 后面的逻辑其实都是出问题了 他们的话 开始也要证明cosine二十 就是通过九度和二十七度 然后就是又回到了前面说的从七度和二十一度这么的关系上 那这其实是什么都证明不了的 也就是说他们的一个逻辑链条思考深度没有那么的长 但是好玩的是 如果说你直接去问每一个模型十九度是不是个无理数的话 那大部分模型是可以推理出来的 换言之 对对 这里面如果说我们把它总共推理的一个关键步骤作为一个衡量标准的话 就可以看到 大部分模型从cos九度开始的话 它的一个逻辑深度是可以触达最后的一个结果 但是当我们要从cos七度的时候的话 相对于说整个逻辑的一个深度要更加长了 那大部分模型是hold不住了 包括像那个gerina和sonate 你直接问他们cos九度 他们的逻辑链条是可以hold得住的 那是七七度到九度中间还有一次那个比较长的一个逻辑的一个推演的 它就hold不住了 在这个里面的话 deepsik是什么程度呢 deepsik它就是属于是跟那个o一 跟那个四o是一样的 他们会指指DES会直接想办法通过七度和二十一度之间的一个关系关系来证明一个七度它是无理数 但是二十一度是无理数 其实并没有被证明的 所以说DS在推理逻辑深度方面 其实是跟o一和四o是处于差不多的水平的 senitter和jm的话 略高 就是深度略深 其中表现最好的其实是nejm呢 二点零flash它这个逻辑深度是最深的 相比较而言的话 那个二点零flash的一个thinking版本 它的逻辑深度其实反而没那么深 从我个人的角度来看的话 因为它把中间的大量的token是用在了就是所谓的中间思考这一个过程中了 因为它是要输出中间思考 所以说导致它的一个逻辑深度其实反而被压缩掉了 嗯 这里面的话 是要看每个模型自己它内部的一个实现方式的 因为闭源的话 我们是看不到 所以说这个不没有办法去做一个从底层来看它的一个分析 只能从表象上来看 那至少从这边来看的话 思考深度上面的话 目前和jamnesensenate是是优优 SOO其实是在第二道 这也其实前面一开头所说的 并不不说一个模型型个DS 或者说是那那sensenateor时 说是它就可以包打天下来 它并没有强强那个程度的使我们上等于说在那个深度逻辑的一个测试中的两个我们经常会用的一个案例 就是这两个案例通过了 完了我还会去看 去测试其他的一些深度的一些情况 然后还有一些测试 比如说我们会去测试 你知道什么来着 他制定计划的一个能力 这个是在我们另外一项游戏项目中的话 我们会让那个每个AI局根据游戏规则来制定自己在场上的一个游戏的一个策略 然后会根据每一局的一个结果来调整自己的策略 这里面其实在策略制定上面最好的是国内的GRM 它的策略制定其实是非常好的 但是它在策略执行上面是非常糟糕的 这个真是蛮好玩 也就是说 它就属于那种典型的我PPT可以写的很好 但是代码写的像坨屎一样的 就是这么一个情况 但我这只是那个夸张的举例子 我并没有说GM它就是代码写的 长常师在IDDD要分清楚 我这个只是举个例子 开个玩笑 并不是说它就是在第一第一回 GIMGM代码写的能力其实也是可以的 特别是最近的版本的话 还是可以的 虽然说从写代码角度来看的话 它还达不到第一档 比如说我之前的话 写了windows上的一个插件系统 那插件系统其实魔搭 呃 那个windows是windows 十一和十二上的插件都是那个snet帮我写的 然后因为那个时候DS的的那个v三和阿都都还没有出 还没有出来嘛 所以说 到目前为止的话 从测试结果上来的话话 在制定策略这一块 DS的一个制定的结果并没有那么的好 然后的话 相比较也话 GM的策略略是最好的 然后是o的策策略制定还是OKK在策策略的执行面面是严格根根据我制定策策去进行 游 游戏这个角度来说的话 一和双份的net目前也是在第一档 DS的话 还是略有差距 但差距没那么 没那么大 相比较而言的话 国内难打的也真的就只有它了 剩下包括这策略制定的好 但是执行起来像头是一样的GLM 那这个 我这 这个就没法说了嘛 所以说 我们在自己内部的一个多agent 就是所谓的multiiagentworkflow的一个项目中的话 那策略制定这一块的话 GIM的权重会偏高 然后在策略制定完之后的执行上面的话 其他的一些模型的权重会偏高 然后这是个然后再回到推理上面的话 前面漏说了一点 就是DS就是deepseek 它在推理上面的话 有估计它是很明显的会有过度推理 它的过过度推理的话 就相当于说 比如说我谈一个很简单单的一个问题 它在thinking模式的thininking阶段 会输出很多的一个thinking的过程 包括什么正向思考 反向思 思考 主路思考完之后 再化散从旁路去想 就所谓的COT和TOTT都都会 这 这个其实很好 但对对面对一个简单题的的时候 你把大量的的token用在COT和TOT上面 其实一点意义都没有 这个真的是属于过度思考 甚至有的时候过度思考的结果反而是令整个反馈的答案并不是我想要的 而是一个就是类似于你让一个大学生去证明一加一等于二 他给你来了一大堆代数和评论里面的 完全没有必要说 这个是DS的目前r一版本一个很显著的问题就是它会有过度思考 在一些简单任务上过度思考 浪费token不说 反而会得到一些更加糟糕的结果 是它的一大问题 VS呃 v三在这方面的话 它不会存在过度思考的问题 但是整因为没有过度思考 所以说它相当于说在thinking环节中没有TOT和CUT 因为它根本没有cking环节 或者说有也是非常少 这样的话 它的整个一个效果其实就没有那么好 所以说它的一个平衡的话 v三和r一正好是在两端 它并没有达到一个非常好的一个平衡 如果说你要完成日常任务的话 那你其实也要去思考 这个任务到底是呃所的思考的生好 还是说不需要思考的很深好 因为并不是所有任务都是需要他要去过度推理 过度思考的 这个是大家其在使用时候一定要去想清楚的一个问题 OK 然后的话 还有什么呢 还有比如说让他去生成那个所谓的给苏oner的一个chip的一个取部方面 目前苏宁t还是可以说我目前用起来还是最好的 至少在这个领域的话 snater比DS还是要好一点 当然了 DS还是比OE至少在这个领域上面是要好 所以说 不同领域的话 其实你还是要去选择更加适合的一个AI模型是比较好的 包括在写文章方面 事实上国内现在吹嘘了很多的写文章东西的话 大家因为互联网是有自忆的嘛 你回头去看sneate刚出来的时候 包括OE刚出来的时候的话 类似的炒作也是炒作过一波的 那这里面还是有区别的 比如说DS在中文知识方面 的确做的是比那个略特 比那个那个叫什么来senoXX要好 这个是显而易见的一件事情 包括在所谓的语言的原认知方面的话 它这个优化肯定是做过的 你比如说最经典的问题题 那那个starberry里面的话啊 有几个这个的话 它是属于 它并不是属于语言问题 而是属于一个源语言的问题 是要在这个分类里面 因为是比如说我你AI在思考的时候的话 它并不是一个字母一个字母去思考 它是一个token 一个token 一个在英文中的话 一个token它可能是对应的是 比如说一个单词 或者说一个单词中的一个前缀或者一个后缀 它并不是以一个字母为单位的 这个其实就跟我们写汉字是一样 我们写汉字的时候 是以字为单位 而不是以笔 笔画为单单位的 同样的 在中文问题上面的话 它在一个原语言的认知上面的话 它基本上也是以字为单位 而不是以笔画为单位 所以说 当你在那个DS之前 你问比如说问senneate 问OOE 比如说我这个字里面横有几笔 它其实是回答不出的 因为在它里面的话 最小单位的话 是token 而而这个token对应的是一个字 甚至说是一个词组 它不是说一个偏旁部首 也不是说是一个笔画 所以说这个问题它是回答不了的 这个情况就好比说是我告诉你的一个东西是 呃 已经打包过了 打包的这个包裹里面是什么 你在看不见的情况下 我问你这个包裹里面有些啥 你根本不可能回答出来 这个的话 要解决的方案的话 只有说我去把这方面的一个信息也在训练的时候让他去学学过 你比如说我让他去学习每一个token他对应的一个单词 它里面的字母的构成 笔画的构成 我让他去学过了 他才有可能知道 我没让他学过的话 他其实是不知道的 那我比如说再问你一个问题啊 我在a四纸上面再用的惠普打印机打印的时候 一个撇里面墨点有几个你知道吗 你不知道有会很简单 你没有学学习过 没学习过情况下 你是不知道的 而且这个的话 你比如说是那个一撇的话 我没记错的话 惠普应该是三十五个墨点 但是别的一些打印机可能只有三十个墨墨点 对吧 这就是所谓的不同的字 它可能的一个构成什么 它是属于原认知的这么一个范围的 你没学过 你就是不知道 但是这并不妨碍你去理解你这个单位之上所构建出来的一些信信息 比如说你不用知道 比如说中文里面我字 它每一笔它的有墨点有几个 你不需要去知道 但是你看到我自己是可以认识出来的 所以说 你的信息最小单位是以字的为单位 当然我们人的话 可能是以笔画为单位 而不是以墨点为单位 这个问题我相信我应该已经解释清清楚了吧 OK 在这个里面的话 很明显 DS它在这本圆人之上的一个训练 一个学习 肯定是比那个senonate OE肯定都要强强 比如说那个soonneate里面的话 你问他stabberer里面啊 有几个 他回答不出来 OE也是回答不出来 因为他没有学过 他就回答不了 就很很自然的一点 包括的话 你再就是那个图像识别 包括深图这个两块的话 同样的 你比如说以sennetes 还有那个比如说OE和达利他们的话 他在一个图像识别v上面的话 西方画作的一个训练比较多 东方的画作他训练不足 最又导致他对于东方画的理解其实没有那么好 包括在那个达利三他的是生成绘画的时候的话 他在一个东方画作的一个生成 明显就比西方的画作是要差很很多的 就是因为训练量不足 训练量不足 他得只能够说是他没有学过 并不能证明他整个一个系统他的能力是有问题的 因为就还是那句话吧 你没有学过 没有训练过的东西 我让你去做 你做 做出来是天经地义的事情 但不表示你这个人他就笨啊 对吧 一个人 他比如说学的全都是那个 嗯 学的全都是 我是说的夸张一点 他学的全都是高等数学这一这一块的 你突然间问他一个英文问题 回答不出来 能证明他是个傻子吗 这是证明不了 对吧 所以说 这个里面的话 他有针对性的去学习 但是并不表示说他的消防员能力的确是比别人要强 只是说他学完之后所表现出来一个综合实力的确是比别人是要强的 那这个是没问题的嘛 OK 然后下面的话 还经就是相当于说 我的意思是说大家在鼓吹DSODS的确现在在第一梯队 而且在国内的话 是唯一的第一梯队的选手 但千万不要把它给捧成说他就是那个遥遥领先 全球无无敌 就是所谓的那个华为式的一个吹捧 放在DS上面的话 对于DS的发展而言 只能起到一个反作用 然后的话 再回到比较基础的方面的话 别人我的就是DS 从整整个技术角度来说的话 它的一个最大的意义是让全球的人们都看到 我们不再只是一个单纯一个追赶着 而是说我们现在已经追赶到了第一梯队 就相当于说 我们之前在谈论国内和国外的一个AI差距的话 普遍认为会有至少三年啊 三个月 长的话可能是半年 一年都是有可能来这个差距 DS的话 他至少告诉我们 现在我们跟别人站在同一条起跑线上面 但是千万不要认为就是说我们已经超越别人了 在部分领域的确是有超越 但是你说他是全面超越 这纯属扯扯淡 捧杀式的一个吹捧是并不需要 这是没有好没有好处 只有坏处的一件事情 然后的话 这个里面让如果看他的论文的话 看它整个效果的话 我话可以发现 他把很多就是前面包括有人从那个零几年一几年写的论文中的很多的一些方案把概有机的结合在这个里面 并且让它真的可以跑成功 而且它里面也是有一些自己的创新的点的 并不是说它都是拿着别人的论文在用 而是也的确是有创新点的 因此从这个角度来说的话 它在整个AI的一个创新的一个技术发展层的话 现在已经站在第一梯队上了 而不只是一个感追赶者 而是有超越的机会的 虽然说现在还没有完全超越 但是以后的话 说不定它就真的是完全超越了 这是完全有可能的嘛 对吧 因此这个是它的一个意义 而且在我个人看来 它更大的意义不并不是说它在这个技术点上面追赶上了 或者说有一定的超越了 它最大的意义在于是 就是它这次一个最强大的一个token的使用量 以及它整个的一个token费用 再加上我运行它的一个就是所谓的一把权重下下来之后 可以全部运行的一个设备的要求 都降低了很多 它token使用量是比原来是要省用它的MOE里面有一个所谓的expert的一个那个负载均衡的一个balance系统 这套算法其实是相当于说 我只需要激活很小的一块脑区就可以 这个是跟生物是非常像的 比如说你问我一个问题的时候 你一个语言类的问题 我可能就不用去调用跟推理相关的一个脑脑区了 人类大脑 生物大脑本来就是这样的的 它这方面把它给做的比之前的包括那个OE啊 包括XXent的的话 应该都这方面都都是要好的 就是它这个token使用量大大的降低 这是非非常好的一件事情 再加上的话 它使得整个东西的一个就是那个token的费用 我们记错的话 应该只有o一的好像是二十 二十分之一 还是几十分之一 这是非常小的一个量了 最关键的是 它让我们在一台单一的设备上呢 就可以把它给跑出来 这个的意义在我看来的话 是比它的一个token费用 token使用量量是更加重要的一点 因为它这个东西就意味着我们可以去讨论所谓的边缘a 边缘AAI了 我们之前在做各种各样的一个所谓的分布式的AI的一个方案中的话 其实最大的一个问题 就比如说我们自己做的方案 包括苹果做的方案 最大的问题是边缘AI的能力不够强 你像那个苹果的方案 谷歌的方案中的话 会有一个环节是它会判断一个问题是否是边缘可以去完成的 如果说这个问题很复杂 边缘AI完成不了的话 把它给提交到就是云上面 让云上面的AI去完我完成这个思路其实一点问题 一点问题都没有 问题在哪里 再再是边缘缘AI真的很挫啊 你比如说像是谷歌的那个german的 呃 nano版 nano版的话 现在在浏览器上是可以跑 但他问题是首先速度慢 第二个问题是回答质量非常差 以至于根本不可用 如果这样子的话 你这个边缘加上云的这套方案 其实边缘端基本上就是废掉的 那你这个东西应用这个架构就一点意义都都没有了 包括苹果 苹果如果说它在一个就是内套系统 不管他用的是什么 如果说它在就是所谓的边缘端 它真的是一个响应的时间又长 质量又差的话 那边缘端就没有存在的意义了 边缘端的东西都会被提交到云端 最后他就成为它只是一个云端的一个接接入口 没并没有所谓的边缘AI这么一个东西 他真的在跑 那他这个指个架构 架构很美好 实际上是失败 就跟前面说GM的一样的 他PPT写的非常好 实际操作的写写代码像啊 写的像龙拓屎一样的 这就是个问题 但是DS的话 它让我在边缘上面跑边缘AI 它是真的能够可以跑了 我们拿它一个七b的版本的话 我们自己是试过的 拿它一个七b版本在本地去跑 虽然说跑不到像那个服务器版上面那么好 但是它已经处于一个是可用了 这就完全不不一样了 以前上次那个节目的那个 它是几乎可以说是不可用 我现在是可用了 那这个性质就很不一样了 带来的结果是什么 带来的结果是 我们如果说去看很多那个科幻小说中 经常会去有一个 比如说像那个 呃 机械公敌 还是说是哪个里面的话 没错的话 就是机械公敌啊 就是那个 嗯 打人的那们们 叫什么来着 那个 那个威r 威尔史密斯演的那个 里面他有个 就是那个所有的AI 除了那个站在主角这边的AI之外 所有的AI它其实都是由主脑来控制的 然后你只要把主脑给干掉了 所有的这些坏的AI 它其实就是相当于跟着他一块去死掉了 这是好莱坞的片子里面经常会看到的 可甚至于说都不是莱莱坞片子里面大部分的跟AI相关的一些科幻作品里面的话 基本上作品都是这样的 就是说所有的智慧它其实都是统一在一个主脑别边的 只只要主脑被人给干掉了 那整个所有的AI系统它全部瘫痪掉了 你说可以这么去认为啊 所有的那些机器人都只是主脑的风声 仅此而已 那只要主体灭灭亡了 分身就全部被干掉了 但是DS这东西出来的时候 他告诉我们的是 他们可以不是分身 而是化身 那就心情就很很不一样了 你想 这就意味着以后你每台在你身边的机机器人 理论上而言的话 其实际上是完全有可能做到的 是每个这些就是在你身边的家政型的服务型的机器人 或者说公司里面坐在办公室里面的那些同事机器人 他们的思考都是在自己的边缘的AI 不管是在胸腔里面 还是在头腔 就是炉枪里面 都是那些芯片来完成成 它并不需要上传到云分分的 也就是说云主脑对他们的控制是非常弱的 这个的话 从坏的方面来讲的话 就是说不存在说我把一个主脑给干掉之后 相当于说整个AI就把我干掉 就不存在这种情况了 甚至于说 他们还可以说是那个几个边缘AI去形成一个局域网络 在这里面产生一个边缘的主嘛 都是有可能的 这长真的 这个并不是完全科幻的想象 这个我之前在做区块链的时候的话 有过一个偏算是一个这个 这个也不能说太多 就是偏一些战场类的一些项目的话 就里面会谈论到 怎么用区块链里面的一些所谓的就是那个 呃 像POW这种算法 怎么用这种算法 让在一个类似于正常的这么极端环境中 如果说原来的就是所谓的有控制权的一个节点 它down掉之后的话 怎么快速的形成新的节点 这个是我们在实际研究 而且已经研究好多好多年 你像我做这个项目的时候 应该是一七一八年 到了现在就是多少年了是吧 那这上面的一些算法已经很很成熟了 它所带来的影响就在于 是不存在说你把主板干掉 整个AI就没有了 不存在了 它会快速产生一个新的主脑 甚至于说 在这实际过程中的话 它可能就是会动态的几个这个机器人就聚在一起啊 会形成一个局部的一个中心 对于别的一些AI发号使令 这是完全有可能的 技术上也都是完全可以做到的 我们这方面技术已经研究好多好多年了 不单是国外在研究 国内也已经研研究了很多很多年了 很成熟对吧 那这个的话 会带来来极大的改变就是其一 其二的话 也就意味着 我们本来去想的话 可能会认为每一个机器人 因为他们的所有的东些都是由同一个主脑来控制的 所以说他们可能性格是一样的 但是现在告诉你的话 因为所有的这张图它 它是有边缘计算的可能性的 因此所有的它的每个机器人的经历的话 它是可以只存在于边缘端 而不再是说放到一个云服务器上 一个主控里面去 这样子的话 每个机器人的性格就可以是不一样了 这个的话 相当于说从抽象的角度来说的话 它对于我们以前的对于机器人社会的一个想象 有一个极大的颠颠覆 以前我们对于机器人的想象 其实是比所谓的蜂巢还要更进一步 它就是一组多重的这么一个 一个主体 多个分声的这么一个 它都不是一个蜂巢系统 但现在的话 我们会发现它不单单是一个蜂巢系统 它很可能会跟人类社会一样 它是一个群体系统 而非非一个简单的蜂巢系统 这个的话 相当于说群体系统的话 因为它是边缘端的话 每个节点的话 它这个处理信息的能力会更加单 更加的强调 它会更加的复复杂 而像是一组多重的话 它其实就是很简单的一个系系 因此这个是在我看来带来的一个最大的一个可以说是对未来会产生一个只是极大冲击的一个潜在的点 现在可能大家对于这种事谈论还不是很多 但是我想要提醒大家讲的是 边缘AI的存在 它不仅仅说是一个风口 而是说它会对于整个AI社会的一个形态产生一个极大的一个变化的 而且还包括是你想他们现在的话 这些边缘AI的话 还可以说是跟一个总体AI去进行一个沟通 这个的话 就跟我们人类的话 只有边缘AI其实很不一样了 但是它又和我们过去对于AI的想象力 那么只有中性癌的又是不一样 因此它是一种可以说是我们之前都没有怎么去接触过的一个全新的一个所谓的信息的社会的一个组织形态 这是我们要去认真对待的 因为这个的话 不管是从信息的传递 舆论的控制 还是说从上市什么战场作战啊 或者说公司里面的公司架构啊 等等等 它都是会带来一个极大的一个冲击的 这是大家要去想明白的一个点 然后的话 那基本上对于DS的话 想来的就差不多了 因为更多的一些技熟悉一些的话 我论文还没有完全吃透 所以说也聊不了太多 只能说从我自己做测试的角度来说的话 跟大家分享一些吧 还包括的话 最后所说的关于边缘ARAI这一块 那下期的话来看 可能的话 下期再聊一些轻松的话题 也是跟男爱相关的 那大家下期有什么想听的 可以在评论区评论区里面留言 那今天这期播客就先到这里啦 大家拜拜