第378章通用智力假说

去未来搞点黑科技很正常吧？作者：乌鸦一号投票推荐加入书签留言反馈

    第378章通用智力假说
    “新一届计算机界最高荣誉图灵奖揭晓，
    3月20日，阿美利肯计算机协会acm莱特·陈为2026年acm图灵奖获得者，以表彰他在人工智能理论方面的基础性贡献，包括重塑了人类对脑电波和人工智能联系的认知。
    莱特也是第二位同时获得诺贝尔奖和图灵奖的科学家.”
    每年的三四月份左右会公布前一年的图灵奖得主。
    hbm在2026年年底一经公布，就成为当年图灵奖毫无争议的得主。
    阿美利肯计算机协会把图灵奖颁给任何其他学者，他们只会觉得这是一种侮辱而不是荣幸。
    因此acm也没有拖，在3月底就直接公布了，他们也知道陈元光不可能来阿美利肯参加颁奖典礼和颁奖晚宴，因此只是派姚院士尝试着联系了一下陈元光。
    果然不出acm所料，陈元光拒绝了，甚至没有答应通过机器人的方式远程参加。
    不过他倒是提出了一种新的方式，那就是派代表去参加，“姚先生，我到时候会找一位青年学者作为我的代表代为领奖。
    同时我会让他讲解一下我最新关于人工智能方面的一些思考。”
    姚院士作为图灵奖的第一位华人得主，陈元光不是给acm面子而是给姚院士面子。
    “是否能麻烦你帮我在acm的图灵奖颁奖典礼上代为领奖，并且讲解一下这篇论文的内容，具体内容详见附件”
    杜高和往常一样来到办公室，习惯性打开自己的邮箱翻阅过去24小时的邮件往来。
    一封发件人署名为元光的邮件一下就吸引了他的注意力。
    元光？在他认识的人里只有一个人叫这名字，但人们一般不直接用真名称呼他，而是叫他光神。
    杜高是申海科大的副教授，过去主攻课题是深度学习。
    由于研究生阶段做过一些关于脑科学的研究，因此在申海科大做博士后期间，申请了和脑科学相关的机器学习课题。
    最终该课题在申报过程中没有被自然基金看中，本来以为最多能够评个省级课题，结果被陈元光看中，成为了21世纪人工智能领域最伟大发现之一的hbm技术框架的前置研究组成部分。
    当然在华国学者看来，这个之一完全可以去掉，chatgpt也很牛，但显然要比hbm人工智能技术框架低不止一个级别。
    也正是因为有幸参与过hbm技术研发，杜高也在hbm相关论文中获得了一个共同作者的名头，博士后还没有做完就获得了申海科大特聘副教授的职位。
    特聘副教授没有编制，但无论是待遇还是稳定性方面都和有编制差别不大，至少放在之前，是杜高想都不敢想的职位，这可是申海的高校，含金量堪比二线城市211或者某欠发达省份的985了。
    过去学历显赫，但博士阶段导师不出名，做的课题在人工智能领域也属于边缘课题的杜高几乎是一瞬间就名声鹊起。
    像百度每年会统计所谓人工智能华人青年学者，从几万名华人学者中筛选出一百人，评价维度有学术水平、学术影响力、学术潜力等。
    杜高之前别说100人，就算是1000人他也选不上，因为这评判标准不是华国人，而是华人。
    华人显然包括了海外华裔，可就是因为参与了hbm项目，他就顺利入选了百度在4月评选的人工智能华人青年学者。杜高是里面唯一隶属于非985/211高校的青年学者。
    其他青年学者的所属机构都是什么海外高校、华国科学院、985/211、国内外顶尖科技巨头。
    杜高很清楚要跟谁混才有出头之日，看到发送人为元光的邮件，他放松的姿态都一下紧绷起来，点开一看具体内容他内心更是心潮澎湃起来。
    “光神拿去年的图灵奖了？这不奇怪，新闻早就满天飞了，网友们甚至都脱敏了，换其他人估计得大吹特吹，这是光神，也就还行吧。
    也就只有光神能说出图灵奖还行这种话了。
    让我去代为领奖，这倒是一桩不错的差事。”
    让他acm颁奖典礼代为领奖顺便上介绍光神的最新论文，这无疑是一种荣耀。不然为啥不喊别人呢？
    光甲航天内部也不少人工智能相关学者。
    其实主要是因为陈元光考虑到如果派光甲航天的员工，大家因为之前那件事有点过敏，怕去得了回不来。
    像陆奇要是代为跑到阿美利肯去参加acm，回不来的概率超过90%。
    杜高对论文很是期待。
    大部分学者靠论文来为自己的学术能力做注脚，而陈元光从来不需要，光是这个名字随便配上一个标题，不需要任何内容，放到任何学术会议上，该学术会议都会给他专门预留时间、场地，全球学者都会蜂拥而至。
    作为开辟了凝聚态物理新方向和人工智能新方向的顶级学者，这就是过往战绩积累的声望。
    “技能不等同于智力，后者仍然没有单一的定义。我们今天可以达成共识的是，目标导向和对不同环境的适应性至关重要。今天的深度学习系统仍然非常有限，因为它们本质上是在大量数据上训练的技能程序。为了衡量人工智能的智力标准，我们需要其他基准，这些基准侧重于泛化和技能获取效率，通过增加这些基准来构建一个统一的标准，这套标准不仅可以用来衡量人工智能的智力水平，而且可以用来衡量人类的智力水平.”
    “关于智力这个术语，研究人员对一个单一的定义仍然没有达成科学共识。但是，智力的常见特征包括两个方面:特定于任务的能力(“实现目标”)以及通用性和适应性(“在广泛的环境中”)”
    “过去进化心理学对人类智力的看法认为许多认知功能是由于特殊目的的适应。换句话说，人类的大脑已经进化到擅长某些任务，因为这些技能是生存所必需的。这种观点引起了针对特定任务性能的情报和评估协议的定义。这种方法的问题在于它缺乏通用性。只专注于特定任务的人工智能通常在这些特定任务上表现要远优于人类。但在解决一般问题时，它们缺乏人类的灵活性和适应性。
    因此，在过去人工智能智力衡量标准中对特定任务性能的关注导致人工智能缺乏普遍性.”
    “另一种常见观点认为智力包括通过学习获得新技能的一般性能力，这种能力可以针对各种以前未知的问题。这种对智力的认知反映了另一种长期存在的看法，这种看法强烈地影响了认知科学的历史，它与进化心理学的观点形成了鲜明的对比:将智力视为一种灵活的，适应性，高度通用的过程，将经验转化为行为，知识和技能.”
    杜高觉得自己的知识储备有些不够了，整整上百页的内容，里面大量关于认知科学的内容哪怕他接受过部分脑科学相关课程，仍然阅读起来非常吃力。
    无论是陈元光提到的进化心理学还是认知心理学，杜高觉得自己都有必要提前补课，或者找本校对应专业的教授进行咨询，才能把该论文的通读给进展下去。到颁奖典礼上去，如果只是单纯念稿，那没啥问题，念稿谁都会，要选总统的候选人能够在演讲过程中全程看提词器，他看提词器也问题不大。
    可会后晚宴其他学者们的疑问全部推给光神就完事了，反正你问我什么，我都说我不知道，我是来帮光神出席这次颁奖典礼的。
    但无论是陈元光在邮件中的要求是讲解，还是说杜高希望在acm颁奖典礼上和大佬们混个脸熟，能够和顶级大佬们有一些学术合作，他都必须要对论文有着足够深的把握。
    更何况，什么是先机，这就是先机。
    hbm诞生后的这半年，各大学术期刊和学术会议有超过一半的论文都是围绕hbm展开。
    对hbm人工智能模型的验证可以发论文。
    自己制定一个评价标准，然后自对hbm人工智能模型进行改进，在自己评价标准里相关参数有所提高又能发表一篇论文，类似的论文不胜枚举。
    用华国产的拓扑半金属计算卡和阿美利肯的英伟达计算卡分别训练hbm人工智能模型，然后分析他们之间的差异，论证英伟达计算卡为什么训练效果不佳也能发表论文。
    分别用不同城市司机的脑电波数据对应训练hbm模型，然后分析两种hbm模型在自动驾驶中的差异，看他们和不同城市司机的驾驶差异是否吻合，同样能发表论文。
    陈元光把hbm开源，工业界的应用还没有诞生多少，但学术界的论文已经大爆炸了。
    你只要有个稍微好点的想法，就能够基于hbm模型发表论文，期刊们也爱发。
    围绕hbm模型的学术课题简直就像一个诚信互刷的副本一样，大把的人在里面厮杀。
    现在光神看大家副本好像有点少，又来开辟新的副本了，而杜高抢先知道副本位置，肯定要借助这样的优势猛猛刷怪。
    他都做好准备了，一边精读该论文为在acm颁奖典礼上讲解做准备，另外一边围绕光神给出的方向，自己多写几篇论文，申海科大一年的学术kpi就完成了，剩下半年还不美美躺平。
    另外在精读论文的过程中有任何疑问都能邮件请教光神，还有比这个更好找光神拉近距离的机会吗。
    说的夸张一点，也算是读了光神的研究生了，阿美利肯顶级名校不少这种一个课题就结课的研究生，还都是顶级名校的项目。
    耶鲁专门针对老中推出的项目，只有八个月的授课型硕士，快进快出学费一点不少，入学门槛还设置的贼高，纯纯给你过一道耶鲁，套个新的出身。
    “你是说你想给人工智能的智力评测设置一套标准？”杜高通过自己在浙大的同学约到了浙大心理与行为科学系一位青年学者刘鹏飞。
    对方在浙大还没拿到教职，属于三年期非升即走的阶段，做的课题和人工智能沾点边。
    刘鹏飞只觉得杜高有点急，昨天才约好，今天下午就在浙大门口的咖啡馆见到了。
    杜高说：“没错，不是我的想法，我这是帮我认识的一位前辈问的，他制定的这套标准不仅要测人工智能的智力，还要测量人类的智力。
    相当于这套标准需要做到既能衡量人工智能的智慧程度，又能衡量人类的智慧程度。
    把这两者纳入到同一个范畴里。”
    刘鹏飞一下就明白了对方的意思，这不是什么新的想法：“之前很多学者都想过要做相关研究。
    老实说这不是什么新的idea。只是大家在尝试过程中没人能够做出一个好的结果。
    毕竟过去对人工智能智力的测评，是基于技能熟练与否的度量来作参考标准。这种对特定任务的关注会导致在其他方面度量的缺失，比如稳定性和灵活性。
    所以这需要超越基于技能的评估的标准，需要一套更高泛化等级的系统。
    这套更高泛化等级的系统，难点在于，这套泛化的评价体系，如何去度量人工智能处理此前从未处理过情况的能力。
    智力测试和技能评估其实属于心理测量学的范畴，它也是心理学范畴。但既然是测试，那么势必然说明这套评价体系是针对特定问题展开的，人工智能完全可以通过专门训练来解锁这套评价体系。
    所以这太难了，我不认为以现有学术框架能够做到这一点，如果你朋友能做到这一点，我觉得他拿一个图灵奖绰绰有余。”刘鹏飞认为杜高的朋友不切实际。
    杜高心想，不，今年的图灵奖只有可能颁发给我这位“朋友”，哪怕他本人不会到现场去领奖。
    “另外你听说过g因子假说吗？”刘鹏飞问道。
    杜高摇头：“没有。”
    “这是关于智力研究领域心理学家们提出来的一种假说。
    因为智力测试有很多，像韦氏智力测试、斯坦福-比奈量表、瑞文标准推理测验等等，这些测试的侧重点不同，但有些人在各种智力测验中得到的分数都是趋同的，都比较高。
    而且这些人在生活中各方面的表现，似乎都比其他人要好一点点。学习任何领域都会更快一点，上手任何技能也都比其他人要更熟练。
    所以心理学家们猜测，这背后是否存在着通用因素，使得这些人的智力表现整体就更高。
    这个通用因素就像一个催化剂，可以跟不同领域、不同技能结合，让他们在方方面面的表现都更出色。
    这也是最近这些年比较流行的g因子理论，g是general的意思。
    如果你那朋友真的想要做一个整体性的框架，那么我觉得先找到g因子，然后验证人工智能也符合g因子假说，会是一个不错的方法。”
    (本章完)

第378章 通用智力假说

第378章通用智力假说