凤凰网科技讯 北京技巧8月21日,近日,Meta八月未央 自慰偷偷地发布了一款新的集中爬虫,用于搜索互联网并集中大宗数据八月未央 自慰,为其东说念主工智能模子提供撑持。
据三家跟踪集中持取器的公司称,Meta新集中爬虫机器东说念主Meta External Agent于上月推出,访佛于OpenAI的GPTBot,不错持取集中上的东说念主工智能磨砺数据,举例新闻著作中的文本或在线商讨组中的对话。
左证使用档案历史记载夸耀,Meta如确切7月底更新了一个面向成立者的公司网站,其中一个标签夸耀了新爬虫的存在,想干就去吻但Meta于今还莫得公开晓谕其新爬虫机器东说念主。
淫姐姐网Meta的Llama是最大的llm之一,固然该公司莫得清晰最新版块的模子Llama 3使用的磨砺数据,但其源头版块的模子使用了由Common Crawl等其他开首集中的大型数据集。
本年早些时候,Meta的筹办首创东说念主、首席实践官马克·扎克伯格(Mark Zuckerberg)在一次财报电话会议上曾吹嘘说,公司的酬酢平台也曾积蓄了一套用于东说念主工智能磨砺的数据集,甚而“跳动了Common Crawl”。
新爬虫的存在标明Meta雄壮的数据库可能也曾不够用了,因为该公司不绝起劲于于更新Llama和彭胀Meta AI,频繁需要新的和高质地的培训数据来不断矫正功能。
来自Dark Visitors的数据夸耀,众人近25%的最受宽容的网站目下已屏蔽了GPTBot,但独一2%的网站屏蔽了Meta的新爬虫机器东说念主。(作家/余青)
更多一手新闻,宽容下载凤凰新闻客户端订阅凤凰网科技。念念看深度报说念,请微信搜索“凤凰网科技”。
Meta