GPT4最强对手Claude,迎来史诗级更新

发布时间:2023-05-12 18:17:10 【来源:虎嗅网】

  5月12日讯:号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新。
 
  模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经不在话下。
 
 
 
消息一出,评论区直接炸了,网友们蜂拥而至:
 
  疯了疯了!
 
  事情进展得太快了,又是为人类担心的一天!
 
 
 
 
 
  原来,这次更新,将模型的上下文窗口token数提到了足足10万,相当于7.5万个单词!
 
  这意味着,大模型“记性”不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文档甚至是一本书。
 
  而它都能在一分钟之内帮你分析总结完毕!
 
 
 
  要知道,之前市面上几乎所有AI聊天机器一次都只能读取有限数量的文本,理解长资料里的上下文关系非常灾难。
 
  而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10万token的材料,就需要大约5个多小时,更别提还要花更多的时间去理解去消化才能进行总结。
 
  现在,Claude直接一把搞定。
 
  这波,简直是“五雷轰顶”、“反向开卷”GPT-4,因为,后者也不过才做到3.2万token。
 
 
 
  所以,一次性比GPT-4多出3倍的处理量,Claude效果提升究竟如何?
 
  Claude重磅更新:一次记忆10万token
 
  据Anthropic官方介绍,升级后的Claude-100k版本,对话和任务处理能力双双得到极大提升。
 
  一方面,是“一次性可处理文本量”的增加,直接拓宽了Claude的可从事岗位类型。
 
  之前,大模型最多用来处理个几十页的文档。
 
  现在,Claude已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。
 
  最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。
 
  例如,快速理解几百页的开发文档,并根据文档开发应用程序demo。
 
  以Claude之前没见过的一项新技术LangChain作为示例:
 
 
 
  当交给它一个240页的LangChain API报告后,要求它快速给出一个LangChain的demo演示:
 
 
 
  几乎没用多少时间,Claude就快速给出了一个基于LangChain开发的应用程序demo:
 
 
 
又例如,甩给它一个漫长但又不得不听的5小时知识播客:
 
 
 
  它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:
 
 
 
  难度增大一点,30页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:
 
 
 
  除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问Claude最适合拍摄的地点,它很快就能给出几个对应的参考地址:
 
 
 
  最后,官方还给出了一个《了不起的盖茨比》案例,虽然没有demo演示。
 
  他们将这篇喂给Claude后,替换了其中一个角色Mr. Carraway,把他的角色变成“Anthropic里的一位工程师”,再交给Claude阅读,让它找不同。
 
  几乎只用22秒钟,Claude就读完这本书,并发现了Mr. Carraway的“不同身份”。
 
  另一方面则是“记忆力”的增加,带来了对话题掌控度的提升,以及聊天能力的提升。
 
  此前大模型经常会出现“聊着聊着忘了话题”的情况,对话窗口总字数超过几千字后,开始胡言乱语。
 
  举个栗子,如果你用大量提示词设置了一个ChatGPT版猫娘,那么它开始聊天后,可能几个小时就忘记了自己和你说过的话,开始表现出一些“出轨”的迹象。
 
  但现在,拥有一次10万+个token记忆力的Claude,则不太可能出现这种情况,反而能牢牢记住和你聊过的话题,连续交谈上好几天。
 
  那么,目前我们能通过什么方式用上最新版Claude呢?
 
  API和网页版均已上线
 
  Anthropic先是宣布推出了Claude-100k的API版本,之后又火速上线了网页端。
 
 
 
△Anthropic工程师
 
  所以无论你是用网页端还是用API,目前都已经可以直接体验这个拥有“超长记忆力”的Claude版本。
 
  很快啊,已经有网友迫不及待玩上了。
 
  像OthersideAI的CEO Matt Shumer,就试用了一下网页端的Claude-100k总结技术报告的效果。
 
  他先测了波Claude-9k的效果,发现它面对长达上百页的GPT-4技术报告,还是会出现“幻觉”;随后测试新版Claude-100k,发现它给出了有理有据的估计:
 
  GPT-4的参数量级大约在5000亿!
 
 
 
这是它的推测过程:
 
 
 
  不知道这波OpenAI的奥特曼会不会出来辟谣(手动狗头)。
 
  还有一位Assembly AI的老哥,测试了一下Claude-100k的API版本。
 
  在视频演示中,他用Claude-100k总结了一下Lex Friedman的5小时长播客(内容与John Carmack有关),效果看起来也非常不错:
 
 
 
  但无论是网页版还是API,都还不是我们能免注册直接试玩的版本。
 
  之前我们说的不用注册、不用申请、不用“骚操作”就能玩、体验也很不错的是slack端,它的添加方法我们在之前的文章中介绍过,非常简单。
 
  遗憾的是,目前它还是Claude-9k“体验版”。
 
 
 
所以,总结一下就是,这个Claude-100k的版本:
 
  可以用API的方式体验,不过不是免费的;
 
  网页版也行,但需要你有试用资格,没有就去申请,等一等;
 
  Slack端还不行,只是个体验版。
 
 
 
反向开卷GPT-4,网友:卷对了方向
 
  昨天,谷歌刚刚在I/O大会上宣布了数项重大更新,包括:
 
  重构谷歌搜索、开启AI对话
 
  发布大模型PaLM 2
 
  全面开放Bard,不用排队直接玩
 
  ……
 
  这被视作针对微软和OpenAI的一系列反击。
 
 
 
  现在,来自Anthropic的Claude紧随其后,发布如此重大更新,直接反向开卷GPT-4——
 
  有网友评价:
 
  Claude卷对了方向。
 
 
 
  确实,目前大部分语言模型普遍都只能处理2k~8k的token量,大家都在苦苦追寻提高模型记忆力的办法。
 
  比如上个月那篇可将Transformer token上限扩展到100万甚至200万的论文就引起了非常大的关注,不过网友测试效果似乎不太理想。
 
 
 
  现在,Claude直接“业内第一人”宣布做到了100k,并拿出来给大家用,很难不让人称赞。
 
  除此之外,还有网友“站得更高”,称:
 
  资本主义之间的竞争果然很美妙。
 
 
 
  言外之意,卷得好啊卷得妙。没有巨头和各垂直企业之间的你争我抢,我们哪能在短短两天之间又目睹了如此多、如此重大的进展呢?
 
  诶,不过话说回来,鉴于Anthropic是由当初不满意OpenAI与微软走得太近的几位前员工创立,而谷歌也斥资3亿美元投资了这家公司。
 
弱复苏背景下港股怎么走,5-6月港股市场展望
产品、渠道和运营,国产美妆的「三变
大公司正在失去“光环”,毕业生更加务实
美国是痴心妄想弯道超车中国光伏吗
用AI解释AI的时代来了,OpenAI打开大模型思考黑盒
金融业批发市场为何乱象不断,大连银行、青岛银行等多家银行违规遭自律处分
9年“中国本土化”道路正式告终,领英失守最后阵地
风神能否靠“触电”上位,东风“嫡子”深度转型
[ 最新资讯 ]

GPT4最强对手Claude,迎来史诗级更新

  5月12日讯:号称ChatGPT最强竞争对手的Claude,今天迎来史诗级更新。  模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经不 ...

是炒作还是下一张王炸,微软签下核聚变供电订单

  5月12日讯:颤抖吧,人类!2028年,微软将要靠可控核聚变为超强AI供能。  当地时间周三,核聚变初创公司Helion宣布,微软已同意从首 ...

这个小镇承包了国内70%灯饰用品,一年销售上千亿元

  5月12日讯:提到灯饰行业,自然离不开中山古镇。  从上个世纪末开始,灯饰潮流看京沪,京沪灯饰看古镇的佳话便一直流传至今。时至今 ...

ChatGPT如何进入更多应用场景,重新定义网站

  5月12日讯:著名的设计师和认知心理学家、苹果公司前首席人机界面科学家唐·诺曼(Don Norman)曾说:  User experience design ...

OPPO芯片3000多人团队原地解散,3年500亿

  5月12日讯:3000多人的团队一夜之间原地解散,上半年芯片产业最大的暴雷事件,就这样毫无征兆地发生了。  5月12日午间,虎嗅从OPPO方 ...

纯AI驱动主播就被抖音“封禁”,还没取代李佳琦们

  5月12日讯:曾经,在苏州、杭州等地的直播基地,一座厂房内隔出几十个工作室,主播们轮番上阵拼直播时长。如今工作室却空无一人,桌面 ...