让 arXiv 数据焕发活力

Connect Asia Data learn, and optimize business database management.
Post Reply
jrineakter
Posts: 853
Joined: Thu Jan 02, 2025 7:05 am

让 arXiv 数据焕发活力

Post by jrineakter »

在过去二十年中,短短几年内出现全新行业已成为常态。传统的监测工业和学术活动的方法相对较慢,这导致政策决策滞后——这意味着这些行业的全部利益将不会均匀分配。为了应对这种情况,我们正在开发“arXlive”,这是一个由 Nesta 的数据分析和生产系统支持的开源网络应用程序,以便实时监控出版物数据的创新趋势。

就在几年前,世界各国开始在人工智能淘金热中争相抢占先机,国家投资和发展战略纷至沓来。用经济学家的话来说,人工智能现在通常被描述为“通用目的技术”(GPT),它与晶体管或内燃机等其他 GPT 一起,能够极大地革新全球经济中的无数行业。这种全系统性的冲击很可能会带来一个公平的竞争环境,相对局外人可以超越强大的经济体,成为各个行业的市场领导者。实际上,只有当你的经济体已经具备了参与竞争的人才和基础设施时,这种情况才有可能发生。

要想让所有经济体真正站在平等的地位,它们 克罗地亚电话号码数据 需要一些内部信息。如果一个地区或国家能够实时识别新兴产业或技术,他们就可以积极地配备人才和基础设施,做好相应的准备。

我们不久前开始尝试了解这个生态系统,我们的工作分析了来自 arXiv (发音为“archive”)的数据,这是一个流行的预印本网站,科学家在将研究成果提交给期刊和会议之前会在此分享他们的研究成果。这项工作后来成为过去 12 个月内 SSRN 上下载次数最多的前 10% 的论文之一,我们还向 SPRU 和 ZEW 等研究机构的创新经济学受众展示了这篇论文。这项工作发展的最后阶段是arXlive项目。

arXlive 将是一个开源平台,用于实时监控 arXiv 出版物中的创新活动。arXlive 的基础是一个数据分析和生产系统,它可以协调数据收集、丰富和机器学习的稳定管道。最初,arXlive 将有两个主要的 Web 应用程序;其中第一个实际上是我们论文的实时版本。第二个 Web 应用程序将应用我们在 Nesta 开发的Rhodonite算法来识别新兴行业或技术。通过将此实时应用于最新的 arXiv 数据,世界各地的企业领导者和政策制定者将能够获得必要的内部信息,为下一个重大技术颠覆者做好准备。

我们已设定了 9 月上线前两个初始应用的截止日期。从那时起,我们正在考虑几种可能的扩展,例如:

一种用于对 arXiv 数据进行强大的“搜索引擎”探索的服务(包括智能排名和同义词)。
从纸质致谢中自动识别主要资助机构或非正式合作。
段落级主题标记。
Post Reply