尊龙网下载手机网址原来知识图谱是“找关系”的摇钱树?

27 11

尊龙网下载手机网址原来知识图谱是“找关系”的摇钱树?

  

尊龙网下载手机网址原来知识图谱是“找关系”的摇钱树?

  其实,算法工程师没闲着■◆,一日复一日,年复一年,都在用算法提高准确度★★◆■★,尽量把模型设计的“聪明点◆◆◆■”★◆。

  构建大规模、高精度的知识图谱尊龙网下载手机网址■◆★★■★,需要投入很大的人力物力财力,但是用好了能创造很大的商业价值。

  商品标签是“知识理解”后的产物◆■,也是对上面说到的多模态数据的提炼和抽象。

  除了标签之外,商品之间会有一种天然的关系,是“品类”★★★■■,而且商品类别会有多级。

  假如一个电商收入一百亿■■★★◆◆,利用知识图谱提升1%的收入,就是多赚一个亿,摇钱树,非他莫属。

  看懂商品名称是基本功,若连商品标签都不够准确和精细尊龙网下载手机网址,后续的电商运营策略和方法很难做好,成了“拔错萝卜,带错泥”。

  这里被称为◆■◆★★“图◆◆◆★”的东西★◆◆■◆,不是图画的图,而是图论的图■◆。知识图谱数据模型的数学基础源于“图论”■◆★◆★◆。

  机器能在电影的上下文里认出《长津湖》是影片名■◆◆,在歌手李健的上下文里理解《贝加尔湖畔》是歌名,虽然这两个词又都是地名。

  简单说◆■■■,是把零散的信息有效地组织起来★◆,把纷繁复杂的数据变成有用的知识,这是知识图谱的意义。

  简单讲■◆★,计算机视角下,图片和文本★◆,都是不同的“模态”◆■,所以是“多模态”◆★■◆■。

  而除了文本之外,企业有很多数据,图片尊龙网下载手机网址,音频,视频◆■◆,交易记录等,会用多模态技术■◆■◆◆,这种技术的能力更强一些,技术难度也更高。

  为了提高性能,技术能力强的厂商,会用到NLP大杀器——“预训练大模型”。

  知识图谱,英文名Knowledge Graph◆◆◆◆,是一种非结构化数据◆★,属于图数据。

  头部国内电商企业对知识图谱的应用大约五六年前起步,均在2021年左右建成超大规模电商知识图谱◆★■。阿里巴巴有“藏经阁知识引擎”◆◆,京东有“知识大脑”■★◆■■★。

  因为搜索引擎早已离不开知识图谱了,当你轻点鼠标,查找某个问题,搜索会结合知识图谱技术。

  举一个真实的例子,京东商城的品类太多了■★,会用到一种黑科技:用热门品类的标注数据,迁移到冷门品类。

  如今★■■◆◆★,国内头部电商动不动好几亿用户,50亿以上商品相关实体,知识图谱能够达到非常大的规模,能做到覆盖零售全站商品和用户。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台■■◆。申请澎湃号请用电脑访问。

  那些有相同标签的商品就能连起来了,也就有了★★■◆■“关系”。商品标签越多,知识越丰富。

  从多模态信息中得到一批非结构化数据(文本、图像■■★◆★■、视频、语音)中包含的信息◆◆★◆,自动抽取并建立关系,形成知识图谱。

  黑科技背后会有顶级学术会议的论文来支持。也就是说机器理解了一些常见热门商品品类◆★■■,接着■■◆,又“有如神助”般地多学会了一些少见的商品品类。

  通过图表示学习的方法◆■,把顶点和边都用数值化的向量来表示,映射到欧式空间里面计算距离。

z6com·尊龙凯时官方网站,尊龙登录z6,z6尊龙z6电气有限公司