首页 >资讯 > > 正文

何宝宏:围绕开源大模型的挑战很多 其中重要一条是大模型开始反向影响对开源的经典定义

证券日报 2023-08-11 18:20:11

尊敬的邬贺铨和王国法院士,很高兴跟大家交流一下大模型最新发展。我本人读研究生的时候就是学人工智能,后来因为不太好找工作,我就转型去做互联网研究了,没有想到几十年之后,又回来去做回人工智能,但是今天的人工智能看起来是神经网络。

我们也可以看到过去几十年的时间,人工智能在多个领域取得了突破性的进展,虽然它依然会犯错,但是错误率已经低于人类的平均水平,也就是说比大多数人在这些方面的水平要高了。


(资料图)

从技术角度来说,人工智能已经发展了60多年了,60多年来技术路线是千奇百怪,今天似乎在大模型,预训练的大模型,意味着一个新的产业正在形成当中。

这几年从通信基础设施,搞算力的基础设施开始,接下来未来几年我们要搞智力的基础设施,所以我们说智商原来是不在线的,现在看起来智商是要在线的,把智商放到网上去了,这个方向看起来已经确立了。

第三个是TOB还是TOC,通用还是专业的问题,以前讨论很多是对标ChatGPT通用场景的大模型,更多的是要解决基础模型方面的工作,这是一个非常重要的事情。主要是大型科技公司有这种财力和数据实力去做这一方面的事情,可以认为TOC是面向公众,下面很多的方向转向垂类的,一定要聚焦特定领域,面向企业TOB,主要是围绕产品和解决方案来做。如何做垂类的模型,国内外不一样,在硅谷针对特定场景的微调做实验,因为通用大模型还没有出来,不可能围绕它做生态,很多企业是全站式的,自上而下在做垂类的模型。这个生态在国内还需要一些时间,可能要求的门槛稍微低一点,这一类可以理解成私有的,或者专用的,其实就把云计算十年前的一些做法和一些口号,还有一些套路,往人工智能和大模型一靠,就差不多了。可以很明显,基础大模型和通用大模型的优点和不足,行业垂类大模型也有各自的优势和缺点,下一步很可能是走向融合,走向混合。

我们要做垂类行业大模型,为了数据的安全,这些数据不能拿出来,很多数据是非常敏感的,肯定大模型要做私有化的部署。过几年的时间,我个人的判断,就像今天的云肯定是一个混合云和混合AI的模式。

还有讨论今年的闭源大模型和开源大模型,ChatGPT出来是必然的,这个必然是有各种各样的原因。所以接下来对这个行业来说,因为这个行业的特点是赢家通吃,剩下的企业只能抱团取暖,必须抱一个开源社区,大家一起把开源的事情做起来。我们可以认为开源大模型正在刚刚兴起,这个浪潮刚刚开始,谁能胜出还不知道。当年移动互联网里面,苹果手机出来之后,接下来是安卓生态的建设,这一幕会重演,围绕着开源社区的生态,开源大模型面临着很多的挑战,一个重要的是它反向影响对开源的定义。我们对开源的定义是在25年前出现的,当年定义做的开源规则,针对的是软件,针对的是代码,今天人工智能这个开源针对的是模型,针对的是权重,里面很多数据集,大模型的开源和软件的开源,和代码的开源确实不太一样,所以我们需要在人工智能这个时代重新定义开源,今天面对模型,加了很多的数据,至少我看有三个方面的区别,加了很多科技伦理,所以这一块有AIGC产生一些新的内容,它是一个自循环了,会出现无数的问题。

整体来看,国外做了很多的榜单,但是从学术到产业还需要做更多的工作,学术界和产业界关注不一样,产业界主要关注性能,还有可靠性,稳定性,场景适应性怎么样,维护性怎么样,或者你的工程能力怎么样,要用工程化和标准化去做这个工作,所以不能单单以学术界的榜单来判断大模型做的好还是不好。

目前面临着很多一些新的风险和挑战,有技术、心理和社会方面的风险,模型里面有大量的参数是垃圾,到ChatGPT4到了上万亿,大模型大量的参数是垃圾,问题是你不知道谁是垃圾,你知道公司有人在摸鱼,可是你不知道谁在摸鱼,肯定很多参数在摸鱼,你需要做优化,完全是可以做优化。几年前我们讨论的深度学习的时候,做出的决定是一个黑箱,不能做出解决。深度学习到今天,大模型更不可解释的,因为出现了涌现的现象,突然开窍了,突然开悟了,为什么会开悟了,没法解释。但是用于现实和社会,它必须是可解释的,只有可解释以后,才能跟我们的法律、道德伦理和社会的游戏规则匹配起来,还有算力资源的部署有关系,还有人工智能出现了谜之自信的问题,AI的幻觉,对某些知识非常自信,跟人一样有时候也是谜之自信。

在文字方面,人也犯错,所以不要那么苛求,继续努力。在图片方面也相对比较成熟了,美术方面很不错,还有人声合成,对生成音乐和声音相对比较成熟了,模仿一个人的声音时间并不长,现在很多UP主就是用数字化+人工智能训练出来,还有一些视频的,还有编程已经达到了初级程序员的水平,编程就是文字对文字的翻译。还有在科学领域,科学院用的仪器和仪表,也需要人工智能来辅助,还有生物学和材料学等广泛的使用。

还有编程,今天的编程是在训练程序,不是在编写程序。算法要完整,数据只要有结构,算法,框架+数据,对算法细节的重要性没有那么重要了,不仅数据要有结构,还要整个输出。所以从编程序变成了训练程序。

前几年的移动优先和云优先,我们要优先考虑人工智能对我们的影响。我就讲这些。谢谢!

(文章来源:证券日报)

上一篇:丛林花式“捉虫”,他们在干啥? 下一篇:最后一页
x
推荐阅读

何宝宏:围绕开源大模型的挑战很多 其中重要一条是大模型开始反向影响对开源的经典定义

2023-08-11

丛林花式“捉虫”,他们在干啥?

2023-08-11

《燕云十六声》首发150小时单人内容!还将有DLC

2023-08-11

今年火起来的裙子,要算这两款,其中“工装裙”复古又时髦

2023-08-11

早餐多吃这种素馅馅饼 我家最馋这馅饼

2023-08-11

莫让“笑面官僚主义”遮蔽真作为

2023-08-11

47岁中国女子赴美见男网友失踪 基本信息讲解

2023-08-11

世体:巴萨与德国投资基金达成出售俱乐部工作室部分股份的协议

2023-08-11

大行评级|美银:维持港铁“中性”评级目标价42港元

2023-08-11

中国足协:比赛停止后实施暴力行为,两球员被停赛并罚款

2023-08-11

谁说“碎花半裙”俗气?瞧国外女人这样穿,洋气时髦,看着就高级

2023-08-11

证券型基金是什么意思?

2023-08-11

澳洲工人罢工影响供应,未来几个月欧洲天然气继续看涨!

2023-08-11

昔日顶流脏脏包消失在烘焙店 业内人士:网红产品易被仿制导致出现审美疲劳

2023-08-11

河北全省因灾死亡29人,仍有16人失联

2023-08-11

正和生态股东户数增加12.05%,户均持股5.13万元

2023-08-11

陕西本土民营企业自研一箭五星发射成功

2023-08-11

房地产板块开盘大涨 深振业A一字涨停

2023-08-11

甘肃省高技能人才培训基地和技能大师工作室建设项目开始申报

2023-08-11

李大霄:沪深交易活跃市场出台重大利好 散户买股买基可以从100股起以1股递增

2023-08-11

光大证券:云计算业务和云流量快速增长,交换机在数据中心市场迎来巨大发展空间

2023-08-11

7月标品信托成立规模攀升 资金有望加速入市

2023-08-11

售价27980元 春风新车450CL-C正式上市

2023-08-11

蒙自帝苑大酒店(关于蒙自帝苑大酒店简述)

2023-08-11

离婚证可以再次结婚嘛

2023-08-11

雄安新区第四届“智绘未来”创新创业大赛获奖项目巡礼(三)

2023-08-10

正荣地产联交所公告 本公司将于8月25日(星期五)举行董事会会议

2023-08-10

旺达与巨像pc能玩吗(旺达与巨像)

2023-08-10

当地官媒:医生家搜出1.5亿系谣言 网友:这数额难道还报少了?

2023-08-10

洛阳文旅再推力作!《风起洛阳》沉浸式全感VR项目登场隋唐洛阳城九洲池

2023-08-10

发动机机油供不上油,发动机机油什么牌子好

2023-08-10

一个月挣40万元?蔚来销售:有人收入很高 但没那么夸张

2023-08-10

请提前安排时间!这个时段,湖南省直公积金中心暂停办理所有线上业务

2023-08-10

再给我两分钟让我把记忆结成冰是什么歌 再给我两分钟让我把记忆结成冰

2023-08-10

中芯国际:第二季度净利润4.03亿美元 同比下降21.7%

2023-08-10

公安机关侦破“AI换脸”相关案件79起 抓获犯罪嫌疑人515名

2023-08-10

感知山东记者谈|讲好“黄河故事” 让黄河文化厚积薄发

2023-08-10

荣联科技:对外投资设立合资公司

2023-08-10

长沙湘雅三医院9名医务人员联名举报科主任,官方回应

2023-08-10

原神喜茶联动活动怎么做

2023-08-10

这条高铁,开始铺轨

2023-08-10

热门车讯起亚新e代福瑞迪将于明日上市 预计8万元起售

2023-08-10

8月10日 13:38分 智云股份(300097)股价快速拉升

2023-08-10

黄河流域水权交易平台上线

2023-08-10

码上淘是什么意思?码上淘有哪些优势?

2023-08-10

马卡:姆巴佩对现状不感到沮丧,他坚决要履行完最后一年的合约

2023-08-10

上海再破“职业骗薪”案:抓获108人 涉案金额超8000万元

2023-08-10

银川威力传动成功登陆深交所创业板

2023-08-10

内容正在升级改造,请稍后再试!

2023-08-10

高铁站员工出售明星行程获利56万 行径极其恶劣

2023-08-10

“羊城夜市”嗨起来!广州以镇街为单位明确外摆区域时段

2023-08-10

印度政府宣布,限制进口!苹果、三星等巨头已做出反应

2023-08-10

北向资金增仓榜:67股持股量环比增加超50%

2023-08-10

税务部门再推新举措支持中小微企业发展

2023-08-10

华为v30耳机接口在哪里

2023-08-10

8月9日基金净值:南方中证上海环交所碳中和ETF最新净值0.8152,跌0.39%

2023-08-10

东南v3菱悦参数(东南v3菱悦球头保修多久?)

2023-08-10

物语系列动漫还会出(物语系列动漫)

2023-08-09

天空:张伯伦今天参观了贝西克塔斯,并将与他们进一步讨论合同

2023-08-09

时代在变,丰田也在变,电动化智能化转型全方位发力

2023-08-09

8.9日投机的盛世。

2023-08-09

唐砖豆瓣评分为什么那么低(唐砖是烂剧新人演技在线

2023-08-09

兰州市城市轨道交通新一轮线网规划征求公众意见 增加中运量辅助线路3号线、4号线、7号线

2023-08-09

武汉新洲区购房补贴怎么申请(流程、材料)

2023-08-09

加满一箱多花9.5元,92号汽油重回“8元时代”

2023-08-09

大医院号源优先投向基层卫生机构

2023-08-09

中科院苍南籍院士!要用半辈子心血回报家乡

2023-08-09

连续开班11年数百名“村娃娃”受益

2023-08-09

触网上“云”赋新能 宁夏枸杞别样红

2023-08-09

明年有望投入使用!龙岗这一医院封顶

2023-08-09

蒸发式冷凝器(关于蒸发式冷凝器简述)

2023-08-09

西藏波密县举办电商直播带货人才培训

2023-08-09

QCY推出MX1便携式扩音器:180g、28小时续航,99元

2023-08-09

莱昂纳多·法比安·布里安·卡斯特罗(关于莱昂纳多·法比安·布里安·卡斯特罗的简介)

2023-08-09

穆迪下调多家美国中小银行评级

2023-08-09

“幼儿园游泳教练体罚孩子”,官方通报

2023-08-09

农业数字化 种地更高效

2023-08-09

奥副总懂人情世故 两外援不懂,唱汉堡歌解锁0-5密码!球迷:海港进亚冠决赛吧

2023-08-09

大运会圆满落幕,中国代表团金牌榜和奖牌榜居首

2023-08-09

【高清组图】全民健身,“武”动贵阳

2023-08-09

紫建电子(301121)8月8日主力资金净卖出2609.58万元

2023-08-09

《夜上黄鹤楼》上演“诗词奇遇夜”

2023-08-09

任正非突然涉足房地产

2023-08-09

2019年吉普车的专利图像被发现揭示了新的7人座设计

2023-08-09

今日立秋,不懂规矩要吃亏,一定要这样做,为家人收藏!

2023-08-09

很抱歉程序无法在非mbr引导的分区上进行激活(程序无法在非mbr引导的分区上激活)

2023-08-09

免费接种!江西公布具体安排

2023-08-09

推动廉洁文化入乡邻 华南农业大学开展“三下乡”活动

2023-08-08

大力发展群众体育,为体育强国筑基

2023-08-08

诉讼时效中止或者中断的规定是什么

2023-08-08

轮椅女孩发视频自述TFBOYS西安演唱会卖水亏本:手机没信号,好多人没付钱

2023-08-08

cad空心字体怎么恢复_cad空心字体怎么设置

2023-08-08

财政部、农业农村部紧急下达7.32亿元农业生产防灾救灾资金

2023-08-08

企展控股(01808.HK)盈喜:预计中期净溢利500万元 转亏为盈

2023-08-08

历史性时刻!公募基金反超银行理财

2023-08-08

马自达新款CX-5将标配10.25英寸触控显示屏

2023-08-08

交通安全教育内容10条最新7篇

2023-08-08

韩国警方已逮捕59名“杀人预告”发帖者,其中有34名是未成年人

2023-08-08

俄罗斯“月球-25”号探测器将于8月11日发射

2023-08-08

智库:欧美恶性通胀导致利率上升 进一步加快去美元化进程

2023-08-08