返回顶部
返回首页
返回首页
home 您现在的位置: 首页 >机器人应用 > 详细信息
从Web和应用程序中自动提取内容的模型
2022年06月19日    阅读量:124     新闻来源:中国机器人网 vrovro.com    |  投稿

内容管理系统(CMS)是在internet上创建内容的最流行工具。近年来,它们已发展成为日益复杂的网站、移动应用程序和平台生态系统的支柱。为了简化流程,加泰罗尼亚大学(UOC)互联网跨学科研究所(IN3)的一个研究团队开发了一个开源模型,用于自动从CMS中提取内容。他们的相关研究发表在《信息科学研究挑战》上。

开源模型是一个功能齐全的科学原型,它可以提取每个CMS的数据结构和库,并创建一个软件,作为内容和所谓前端(用户使用的最终应用程序)之间的中介。整个过程是自动完成的,因此它是一个无错误且可扩展的解决方案,因为它可以重复多次而不会增加成本。

CMS在网络世界中的重要性

内容管理系统(CMS)支持目前在线可用页面的60%以上。WordPress、Joomla和Drupal等系统之所以流行,主要是因为它们提供了简单的用户体验,从而允许各种非技术用户成为在线内容创建链的一部分。

Joan Giner Migu解释道:“在过去的四五年中,这些系统不仅向浏览器提供信息,还向移动应用程序提供信息。CMS有应用程序编程接口(API),移动应用程序可以通过该接口进行通信以提取内容。”茅lez是系统、软件和模型研究实验室(SOM研究实验室)网络和信息技术博士项目的学生,也是概述新模型研究的主要作者。“这些被称为无头CMS的系统允许以简单方式创建的内容稍后在不同的平台上使用。”

因此,CMS已成为每个应用程序或平台使用的内容和数据的大型容器。这简化了许多流程,但也增加了开发方面的复杂性,这对于管理大量内容和平台的组织来说尤为明显。创建新的移动应用程序涉及复杂的开发工作越来越普遍,IN3研究人员设计的模型简化了这些任务。

Joan Giner补充道:“想象一下,一家大型内容公司管理着1000多个网站和应用程序,并希望开发一个新的移动应用程序,显示每个网站的产品。如果他们想开发每个网站和应用程序之间的连接器,这项工作将是巨大的,而且资源密集型的。它是不可扩展的。”。“如果API已经是标准格式,为什么我们不能制作一个内容提取器来读取和理解API,以标准方式表示它们,并生成连接器来自动将信息发送到新的移动应用程序?”

自动从CMS中提取内容

由Enginer开发的模型鈥攖与他的研究伙伴Abel G贸mez和Jordi Cabot,ICREA研究员和SOM研究实验室负责人鈥攇大大简化了新应用程序的开发过程,从而大大节省了时间和资源。该流程是在欧洲项目AIDOaRT和TRANSACT的资助下开发的,旨在以清晰、自动的方式提取和表示CMS模型,使其更易于用作信息源。此外,IN3研究人员的技术方案旨在生成代码,作为CMS和新应用程序开发之间的链接。

要实现这一点,第一步是为该工具提供CMS的地址和登录信息。登录后,它读取API,理解它,并使用反向工程过程以标准方式表示CMS的结构和内容库。基于此,它自动生成连接器代码,CMS和正在开发的新移动应用程序将通过该代码进行通信。

“这是一种标准化CMS和最终应用程序之间流程的方法,”Joan Giner强调道。“事实上,它最大的优势在于标准化本身。我们所说的是一个在管理内容的组织中经常重复的过程;这个过程每次执行时都涉及到建立一个特定的开发团队,该团队需要花费一系列资源,此外,还可能产生错误。通过自动化,一切都得到了简化,变得更具可扩展性。"

因此,这种自动化CMS提取的模型侧重于可伸缩性,因为一旦创建了CMS的大纲和代码,就可以根据需要多次重用,并在不增加额外成本的情况下集成到未来的开发项目中。

研究人员还指出,这是一个自动模型,可以创建无错误的内容库,然而,如果手动完成工作,开发人员总是会在一行代码中出错。

Joan Giner总结道:“内容管理系统是互联网上内容的主要来源。我们正在使对CMS的访问标准化成为可能,就像过去对数据库的访问是标准化的一样。”。“向前看,这个模型甚至可以用来将CMS变成训练人工智能系统的新数据源。”

标签:机器人应用配件与装备企业聚焦人工智能系统及软件
免责声明: 本文仅代表作者本人观点,与中国机器人网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。客服邮箱:service@cnso360.com | 客服QQ:23341571

全站地图

深圳网络警察报警平台 深圳网络警
察报警平台

公共信息安全网络监察 公共信息安
全网络监察

经营性网站备案信息 经营性网站
备案信息

中国互联网举报中心 中国互联网
举报中心

中国文明网传播文明 中国文明网
传播文明

深圳市市场监督管理局企业主体身份公示 工商网监
电子标识