您好!欢迎来到一线生活-深圳论坛
关注我们
扫码关注官方微信
手机版
手机扫描直接访问

AI时代生存法则:你的职场护城河正在失效

0
回复
96
查看
[复制链接]

1万

主题

1万

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
34659
发表于 5 天前 | 显示全部楼层 |阅读模式
本文整理自 InfoQ 策划的 DeepSeek 系列直播第 10 期节目。在直播中,极客邦科技创始人 &CEO 霍太稳对话腾讯云开发者 AI 产品首席架构师林强,解读了 DeepSeek 成功背后的市场影响、技术优势与创新,以及 AI 将改变什么,我们又该如何为 AI 时代的到来做好准备。
林强认为,AI 始终会作为一种工具存在,主要服务于提高效率和便利性,原创性和创造性的东西仍然会来自人类。但 AI 的能力可能会导致人与人之间的分化,未来智力岗位会越来越多,整体社会的智力水平也会被抬高。 下文为直播部分内容精选,完整直播回放 & 最新直播预约可关注“AI 前线视频号”查看

以下为林强的分享实录部分(经编辑):

DeepSeek 的市场影响DeepSeek 在国内的热度非常高,甚至街边的大爷和楼下的保安都在找我帮忙安装,但其实早在一年多前,ChatGPT 在美国就已经火到这种程度了。国内没有达到这种热度,主要是因为访问受限,界面是英文的,以及国内模型在预训练和超级对齐方面做得不够好。超级对齐是让模型像人一样运用知识,而不是仅仅记住知识。以前的模型虽然知识储备丰富,但不会运用,所以给人的感觉并不智能。
DeepSeek 的的成功可以归结为天时、地利、人和。技术方面,DeepSeek 确实非常出色,DeepSeek 一直坚持自己的技术理想,包括在国内很多人还没搞懂 o1 的时候,科普了推理模型,并且效果炸裂。此外,很多大佬对 DeepSeek 的认可也起到了关键作用,他们不仅支持 DeepSeek 这家公司,更是看好整个领域的发展。
DeepSeek 在论文中提到的 500 万美元训练成本,虽然我们不确定是否准确,但它确实成为了传播中的一个噱头。如果在经济低迷的时期,这种说法可能会受到很多理性声音的反对,但在当前的中美关系背景下,它迅速传播开来。从技术角度看,DeepSeek 极致地应用了强化学习,这在国内很少见。比如,国内的千问 2.5、腾讯开源的混元 MoE 等,大多采用预训练加 SFT,很少强化学习。这种技术上的突破也为其传播助力。传播过程中,DeepSeek 的破圈效应非常关键。对于业内人来说,DeepSeek 只是国内在对齐技术上追赶美国的一个代表,但对普通用户来说,它是一个从 0 到 1 的突破。对业内来说,很多人并不开发模型,但本地化部署让很多人觉得可以自己尝试。
为什么是 CoT(Chain of Thought,思维链)引爆了这一波,而不是 Agent 呢? 尽管 OpenAI 和硅谷在 DeepSeek 火起来之前一直强调 Agent 的重要性,甚至说今年是应用年,但为什么最终是 CoT 火了呢?我们可以从一个具体的例子来看,这个例子非常极端,是一个标准的 CoT 测试题:

在地面上方垂直于太阳光的入射方向,放置一半径 R=0.10m、焦距 f=0.50m 的薄凸透镜,在薄透镜下方的焦面上放置一黑色薄圆盘 (圆盘中心与透镜焦点重合),于是可以在黑色圆盘上形成太阳的像,已知黑色圆盘的半径是太阳像的半径的两倍. 圆盘的导热性极好, 圆盘与地面之间的距离较大, 设太阳向外辐射的能量遵从斯特藩一玻尔兹曼定律;在单位时间内在其单位表面积上向外辐射的能量为 W。T,式中 o 为斯特藩一玻尔兹曼常量,T 为辐射体表面的的绝对温度,对太而言,取其温度 t5.50X10’℃, 大气对太阳能的吸收率为 a=0.40. 又设黑色圆盘对射到其上的太阳能全部吸收,同时圆盘也按斯特藻一玻尔兹曼定律向外辐射能量, 如果不考虑空气的对流,也不考虑杂散光的影响,试问薄圆盘到达稳定状态时可能达到的最高温度为多少摄氏度?
对于普通人来说,这类题目包含很多概念和推导过程,解答起来非常痛苦。Agent 在处理这类问题时也面临挑战,因为如果没有强大的推理能力,它很难完成复杂的推导。但 CoT 的出现改变了这一点。它通过思维链的方式,让大模型能够更好地组织知识并进行推理。
以前,大模型很难深入特定领域。领域专家的头脑中已经固化了很多知识,可以直接运用而无需查阅资料。但大模型之前做不到这一点。CoT 的出现让大模型能够更好地组织和推理这些知识,从而在特定领域表现出色。此外,CoT 还与指令跟随能力密切相关。以前,国内的大模型在执行任务时,比如为 200 行代码写注释,往往会在中途停止,无法完整完成任务。但 CoT 能力强的模型可以完整、认真地完成任务。这种能力对于实际应用非常重要,比如在开发中为代码写注释或进行逻辑抽象。
DeepSeek 的出现重新定义了 CoT,并在国内普及了这一概念。这种普及有两层含义:一是 CoT 在国内出圈了,让更多人了解和使用;二是国内的大模型也开始具备这种能力,比如腾讯在过年期间加班开发了 T1。这说明国内已经具备了与硅谷相媲美的技术能力,不再依赖 OpenAI 的垄断。
DeepSeek 的技术优势与创新DeepSeek 目前只有 V3 和 R1 两个正式的产品模型,但最早引起关注的却是几个蒸馏模型。这背后其实有一个“正本清源”的问题。现在,很多政府机构甚至要求公务员至少安装 DeepSeek APP。这股热度在政府内部兴起后,很多公安局等机构也纷纷跟进,但很多时候无法全面部署,于是开始尝试从 74B 蒸馏出的 13B 等模型。
技术特点与优势DeepSeek 的 V3 是一个预训练模型,通过 80 万条数据进行强化学习,最终得到了 R1 版本。这 80 万条数据其实是非常少的。通常,我们自己做模型时,即使是 6B 或 7B 的模型,训练数据量也至少是 80 万的 100 倍甚至更多。但 DeepSeek 的 V3 只需要 80 万条数据就能通过强化学习得到 R1,这才是它真正用心打磨的核心产品。这 80 万条数据并不是简单的数据量,而是经过精心筛选和优化的。DeepSeek 通过这种方式,证明了即使在数据量有限的情况下,也能让模型具备强大的推理能力。“超级对齐”的能力一直是硅谷领先于国内的关键,甚至被视为一种技术壁垒。DeepSeek 只需要 80 万条数据就能训练出强大的模型,这让硅谷和 OpenAI 都感到震惊。OpenAI 甚至专门发论文论证 DeepSeek 的方法是否真的有效,但最终结果表明,DeepSeek 确实通过 80 万条数据训练出了强大的模型。
开源也是 DeepSeek 火爆的核心原因之一。现在,你可以通过搜索引擎找到很多关于 DeepSeek R1 的训练过程和代码,甚至有人开始还原其训练过程并发布相关数据集。
技术创新与模型架构在 DeepSeek 的发展过程中,其训练方式和推理能力的演变值得关注。最初,DeepSeek 通过少量的“冷启动”数据进行预训练,并尝试进行 CoT 推理。然而,早期的推理非常简短且效果有限。随着时间的推移,模型的推理步数不断增加,思维链的长度和深度也在逐步扩展。这种从简短到长链的推理能力提升,类似于人类在思考复杂问题时的逐步深入。机器不会疲劳,可以持续优化推理能力,甚至在某些问题上超越人类的深度思考。DeepSeek 的这种能力不仅提升了模型的性能,还为用户提供了学习思维方法的机会,帮助人们提升自身的思考能力。


从技术创新角度看,DeepSeek 的多项技术值得关注。例如,DeepSeek 是全球大力推广 MoE(Mixture of Experts,多专家混合模型)技术的公司。尽管 Meta 等公司也在研究 MoE,但 DeepSeek 在这一领域的技术细节披露最多,对行业影响深远。此外,DeepSeek 的多 Token 预测技术和 GRPO 技术也在强化学习领域具有重要意义。这些技术的发展不仅提升了模型性能,也为行业树立了新的标杆。
未来展望与行业影响2024 年是 AI 应用的元年,真正走向应用的核心在于商业化的逻辑。只有当 AI 应用的产出价值超过成本时,才能实现大规模的商业化落地。目前,大厂对 AI 的补贴使得开发者能够以较低的成本接入 API,构建自己的应用。未来,随着技术的成熟和成本的降低,AI 应用将更加普及,甚至可能像在手机、笔记本电脑上运行。开源的 DeepSeek 为小公司提供了自主开发类似产品的可能性,进一步推动了行业的创新和发展。


附录4 篇必看论文:
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcementLearning(https://arxiv.org/abs/2501.12948)

DeepSeek-V3 Technical Report(https://arxiv.org/abs/2412.19437)

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism(https://arxiv.org/abs/2401.02954)

DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-ExpertsLanguageModel(https://arxiv.org/abs/2405.04434)

以下是交流环节实录,经编辑。

InfoQ:对腾讯来说,微信和元宝未来会如何做融合?林强: 我认为未来的结合形态并不是简单地在微信里多一个入口,而是微信的许多功能细节会融入相应的能力。比如,当有人给你发了很长的语音消息,你不想花时间逐条听,未来微信可能会有一个功能,让 AI 帮你总结对方到底说了什么,用 10 个字或 20 个字说清楚,这就是一种融合。再比如,微信现在有很多功能入口,比如支付、设置等,藏得很深,你可能记不住怎么进入。未来,你可以直接发一条消息,让 AI 帮你一键完成操作,比如备份聊天记录。甚至在工作中,你需要给同事或老板发总结,AI 也可以根据你的引导帮你完成。这些可能性都可能出现在微信中,未来的想象空间非常大。
目前,业界对微信作为超级 APP 的潜力感到兴奋,因为它的所有环节都可以通过 AI 得到增强。所以,最终的形态不是产品的简单融合,而是能力的融合。AI 应用将深入到腾讯的所有产品中,不仅仅是微信。比如,现在腾讯的一些游戏已经接入了 DeepSeek,角色对话等功能已经可以体验到,但目前这种接入还比较生硬。未来,随着业态的发展,AI 会与产品融合得更加紧密。
InfoQ:未来 Scaling Law 是否还会继续有效?林强: 严格来说,像 GPT-5、GPT-6 这些未来的模型,我觉得比较悬。如果你用过国外的 Claude 和 GPT-o1,就会觉得现有的能力已经够用了。现在核心命题是降低成本,应该进入应用阶段了。 毕竟,直奔 AGI(通用人工智能)并不是大家的终极目标。大家真正想要的是一种新业态和新的产品机会,这才是我们真正能立足的领域。从技术上讲,我觉得 GPT-5 可能很难产。
InfoQ:未来大模型界面是否会成为新的超级入口?林强: 答案是肯定的。早在前年,腾讯总办就有一个大胆的预测,他们不知道未来的用户交互界面会是什么样的,但一定不会是像微信这样的传统界面。现在,我们可以明确地说,未来的交互界面一定会带有 AI 属性。
InfoQ:虽然大模型现在很好用,很多企业也在用它来构建自己的知识库或进行预训练,但信息安全确实是一个非常重要的问题。如何在使用大模型的同时,确保数据的相对安全呢?林强: 我觉得这个问题可以从成本和开源的角度来看。之前提到 DeepSeek 开源的价值,开源意味着你可以拥有完全自主的知识产权,能够自主掌控。随着成本的下降,未来企业完全可以自主地使用这些技术,就像 Kubernetes 统治开源领域一样,AI 的未来也一定是开源的。腾讯也会积极拥抱开源,通过开源实现完全自闭环,从而更好地保护知识产权。
但同时,企业还需要做好知识品控,防止别人暴力挖掘或通过技术手段提取你们的核心知识。我相信随着 AI 产业链的发展,相关的安全工具也会逐渐完善。腾讯云的安全部门已经在开发相应的工具,当安全真正成为核心问题时,这些工具会以很低廉的价格提供给大家。所以,大家可以放心畅想未来如何开发应用,安全问题会有相应的工具和产品来兜底,不用担心。
InfoQ:您个人是如何将 AI 应用到日常工作中的?林强: 现在 Google 和 AI 搜索几乎各占我一半的时间。以前我主要用 Google 搜索,然后凭借自己的总结能力去筛选和过滤信息。现在,AI 搜索在很大程度上辅助了我的工作,其质量并不逊色于 Google。
在写代码方面,AI 代码助手的体验也在逐步提升。至少,你应该尝试一下像 Cursor 这样的工具,它真的会彻底改变你的开发方式。简单拓展一下,以前“AI 程序员”听起来还很遥远,但目前可以实现的两个功能确实能帮到你。
第一是代码补全。 我们平均一天的代码产出可能有 200 行,但如果有 AI 帮助补全,你写了一行,它能接着写出后面的几行,这会极大地加速你的开发效率。我们在腾讯内部做过实验,AI 补全能 让程序员每天的编码时间从 2 小时缩短到 20-30 分钟,效率提升非常明显。
第二是基于当前文件的编辑。你可以要求 AI 对当前文件进行修改,比如生成一个新版本,然后你可以选择接受其中一部分修改。这种基于上下文的补全和编辑功能准确率很高,它将极大地改变开发者的工作方式。
再往后看,AI 程序员可能会根据你的命令创建一二十个文件,并在这些文件中进行各种调整和编辑。但目前这还不是很实用,因为如果你需要审查几百行代码,可能会花费大量时间,甚至不得不放弃这些修改。不过,基于当前文件上下文的控制和变量编辑,这种业态一定会改变程序员的未来工作方式,对你的开发效率提升会非常显著。
InfoQ:DeepSeek 如何赋能测试相关的工作?林强: 我们正在开展软件测试工作,老板常提到,如果 AI 代码助手能够出色完成单元测试和 API 测试,我们是否就能在竞争激烈的市场中脱颖而出?过去,模型的能力还不足以支持这些复杂的测试任务。但随着 DeepSeek 自研模型的推出,我们已经能够达到与 Claude 相当的思维链水平。测试编写通常包含明确的背景信息和较长的推理逻辑,而被测代码本身的逻辑也较为复杂。如今,借助链式推理(CoT)和指令加强技术,我们有望快速提升测试能力。
许多团队此前一直难以有效推进单元测试。但如果 AI 能够完成 80% 的单元测试工作,开发者只需进行少量编辑即可完善,那么单元测试的推广或许将变得更加容易。同样,API 测试的覆盖率一直难以在低成本下有效提升,但有了 AI 的助力,这一局面可能会得到改观。我可以明确地告诉你,测试领域的生态将在一年内发生显著变化。
InfoQ:客户端工程师除了利用 AI 提升编码效率外,该如何进一步提升自身价值?是否需要转向 AI 开发呢?林强: 只要你学好 Prompt Engineering(提示工程),就能做出各种花里胡哨的 APP。未来,Apple 的 iOS 和安卓系统会越来越深入地在系统级接入 AI 应用,提供 AI 能力。
现在,爆款 APP 越来越少了,客户端工程师的岗位需求可能会受到严重压缩,大家更多地转向做 H5,而不是专注于客户端开发。相反,AI 领域的开发机会可能会越来越多。就像移动互联网对网页的替代一样,AI 移动应用对传统应用的替代将成为新的战场。
但要抓住这个机会,你需要做好几个关键点 :一是掌握 Prompt Engineering;二是解决大模型的延迟和端到端耗时问题,这需要你进行深入研究和了解。你不仅要熟悉各种 API,比如百度的 API、Claude 的 API,还要深入了解其中的技术细节,比如 Tokens per Second(每秒生成的 Token 数)和首次响应时间等概念。
除了技术和工程能力,业务理解也很重要。未来的应用开发,尤其是客户端开发,需要真正结合行业业务,比如能源、光伏等产业。你可能现在对这些领域不了解,但有人正在做这些领域的工作,他们结合客户端知识和大模型,就能创造出新的业态,这就是你的机会。如果你能在公司里做好某个赛道,年薪可能达到 50 万到 100 万,虽然不算特别刺激,但也是一个很好的岗位。
InfoQ:对于学生来说,现在有了 AI 和 DeepSeek 之后,计算机专业的学生该如何学习,以及未来专业该如何发展呢?林强: 我觉得大家其实根本不用焦虑,有了 AI 之后,它可以帮助程序员减少搬砖的时间,加速实现已知的代码编写过程,从而让程序员有更多时间去思考和发挥创造性。这对程序员来说是好事,但同时也对计算机专业的学生提出了更高的要求。
以前,计算机专业的学生刚进大学时,需要学习指针、栈等概念,这些内容一开始都很难理解,需要跨过一个门槛。而现在,合格的程序员不仅要跨过计算机体系架构理解的门槛,还要跨过工程能力的门槛,学会如何组织代码和项目来解决问题。如果你没有这种工程能力,AI 虽然能帮你做事,但你得告诉它怎么做。如果没有这种能力,你很难成为未来的合格程序员。这就要求学生连跨两个台阶,但其实不用焦虑。因为虽然台阶更高了,但路线却更清晰了,未来的工作会更注重智力创造
InfoQ:AI 对医生、律师等职业的影响有多大?是否会替代他们的工作?林强:AI 是为医生赋能的,而不是替代医生。医生的工作不仅仅是掌握书本上的知识,这些知识我们都可以通过查阅获得。但真正的医生是通过接触大量病例,凭借经验在大脑中完成强化学习和总结,从而理解书本知识在真实患者身上的细微差别。因此,AI 只能赋能医生,而不可能替代医生,这是我个人的判断。
对于律师行业,AI 确实带来了很大的挑战,但我们对律师行业的理解往往是抽象的,而非真实的行业全貌。实际上,律师对法律的熟悉和应用只占其工作技能的 5%。律师的核心价值在于处理法院流程、与不同社会阶层的人沟通,以及与高端人士建立信任关系。这些能力才是律师行业的核心价值所在。AI 的出现肯定会带来行业工具的变革,但律师行业的本质是与人打交道,这种社会网络的建立是 AI 无法替代的。
InfoQ:未来人与 AI 将会是一个怎样的关系?林强: 我觉得我的技术背景不足以给出确切答案。就像 2000 年的人幻想 2025 年的手机会是什么样子一样,我当年也很难想象出触控屏幕手机会如何改变生活。所以,我只能基于我的理解来谈谈看法。
我认为 AI 始终会作为一种工具存在,主要服务于提高效率和便利性。原创性和创造性的东西仍然会来自人类。但 AI 的能力可能会导致人与人之间的分化。比如,就像美国副总统万斯写的《乡村的悲歌》中描述的那样,许多美国人满足于一种简单的生活方式:体面的工作、稳定的收入和安稳的生活。这种现象可能会加剧社会分化,就是智力形式的阶级分化可能会变得更加严重。然而,这种分化也会对社会产生导向作用。
未来,智力岗位会越来越多,整体社会的智力水平也会被抬高。人们将更多地依赖智力劳动,智力能力也会得到加强。但这里的关键在于 AI 的发展速度和人口替代的节奏。如果 AI 替代人类工作岗位的速度过快,可能会导致社会失调,因为前一代人可能还来不及适应智力创造的要求,他们仍然需要收入和体面的生活。但如果这个替代过程足够长,比如延续一两百年,每一代人都会逐渐适应更高的智力要求,那么社会将更自然地回归创造力,人们也会更快乐。作为 38 岁的我,已经有一些固化的观念。如果变革来得太快,比如明年工程师的工作都被取代了,我可能也很难跟上节奏。这其实是一个国家层面需要考虑的问题,但这种向前发展的趋势是无法阻挡的。
今日好文推荐“抄袭”代码,到底是 CTO 的锅还是创始人的锅?!这事儿已经撕3天了
分布式系统编程已停滞?!
Curl 之父:我是如何枕着18万行C代码还能安稳入睡的
刚刚,DeepSeek 突然公布成本利润率高达545%!做 AI Infra 的该慌了?!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系我们

免费联系电话

400-8855-271

客服QQ:2524604571

服务时间:周一到周日8:00-23:30

关注我们
  • 关注官方微信

  • 手机APP