
大家好,欢迎来到黑马公社。
最近流行了一个搜索引擎,
说它是搜索引擎是不对的。
毕竟它不认为自己是搜索引擎,
同时,它的搜索方式也不如百度搜狗。
那么,它的出现有什么意义呢?
官网介绍
Magi是一个基于机器学习的信息抽取和检索系统。
来,我们看上图:
怎么样,是不是还觉得有点懵?
我们不妨这样想,
把一本书的每一页分成一个网站,
我们想尽快找到指定的内容 as possible
书的目录是否有必要去搜索?
Magi 起到了提供目录的作用。
那么,它能做什么呢?
如前所述,
Magi作为一个互联网目录,
因此它可以显示搜索结果的原始来源,
此外,通过机器学习,
它还会不断地总结和检索新的内容,
让自己的数据库始终保持最新。
那么,让我们看看它接下来能做什么!
打开Magi随意搜索一个品牌后,
我们可以在这里看到关于这个品牌的各种标签。
是的,Magi喜欢通过tag来介绍品牌。
虽然标注不被大多数人认可,
但你不得不承认这是最简单有效的方式。
不过,
麦琪的标签不像人的心情那样随意,
而是都有数据来源。
以“全球第二大手机制造商”为例,
点击该关键词后,
软件会弹出相应的数据 source,
而最右边的是一个机器优先学习网站。
点击这个网站后,
我们可以看到网站里有一句话:
“华为的优势在于已经是第二大了” 世界手机制造商”,
而这句话就是麦琪标签的由来。
通过这种搜索方式,
我们可以很容易的知道麦琪的信息来源,
然后通过信息来源确认事情是否属实。
当然,这种标注方法虽然很简单,
但是很容易翻车。
这里可以看到关于“华为”
同时出现了“全球第二大智能手机制造商”和“全球第三大智能手机制造商”。
点击“全球第三大智能手机制造商”后,
我们看到了不同的信息来源。
那么,华为到底是“全球第二大智能手机厂商”还是“全球第三大智能手机厂商”?
我们不知道,
至少通过这次搜索我们不知道。
对于这样的情况,
Magi增加了一个“可信度评分”,
评分越高,条目越可信。
另外需要注意的是,
机器学习不是通过一篇文章来学习的,
而是通过大量描述相同学习的文章进行的 出去。
不过,Magi对于某些来源的权重是多少,
是否存在来源检索偏差等问题,
黑马未知。
经过几天的实践体验,
黑马并不认为Magi有可能取代百度。
文章前面我们讲了Magi的优缺点,
其实还有很多其他的优缺点没有说到。
比如用它来查找某个品牌的产品就非常方便,
它可以帮助您简单明了地找到您的目标。
然而,它的起源……很难描述。
不知道是不是刚出现的缘故,
Magi喜欢在一些与主题内容无关的内容中抓取数据。
例如:
有一篇文章主要介绍DxOMark对新机的评分,
但是Magi在这篇文章中抢走了三款华为机型。
那么,那是……为什么?
去品牌官网商城之类的地方不是更好的选择吗?
这个数据的来源真是莫名其妙。
还有一个要说的,
黑马搜索“华为手机”,
乱出现的Galaxy Fold是什么鬼 ?
点开信息源后,
黑马发现
Magi现有的机器学习似乎不能很好的区分语义,
p>
p>它会自动将连续的品牌型号组合在一起。
针对这种情况,
黑马有一个不成熟的建议:
通过对信息检索进行优先排序,
先验证一部分后 信息
后台锁定品牌鉴权,
这样用户搜索其他品牌型号后,就不会出现这个随机词条了 再次模型。
那么,Magi的实用性是什么?
黑马只能说是考察了。
由于其特点,未来发展空间广阔。
从搜索源、标签、评分等方面,Magi给了我们 一种全新的搜索方式,
为现有的搜索引擎提供了新思路。
虽然机器学习一开始比较笨,有很多缺陷,
但是随着用户的增多,
Magi的算法会越来越聪明。
一般来说,每有一个新事物出现,
总会对老行业产生一定的影响,
但这只会让消费那些 谁从中受益,
形成良好的竞争氛围。