几乎在互联网上的任何地方,似乎都无法避开有关人工智能的文章。即使在UT,我们也已经发表了几篇文章。通常,他们关注特定研究小组如何利用该技术来理解大量数据。但这种模式识别并不是人工智能的全部优点。事实上,它的抽象思维能力正在变得非常强大。抽象思维可以发挥作用的一个地方是发展新的科学理论。考虑到这一想法,来自欧洲航天局、哥伦比亚大学和澳大利亚国立大学(ANU)的研究团队利用人工智能提出了天文学的科学假设。

人工智能可以帮助天文学家快速生成假设

具体来说,他们是在银河天文学子领域进行的,该领域专门研究星系的形成和物理学。最近在arXiv预印本服务器上发表的一篇论文提到,他们选择这个子领域是因为它的“综合性”,这需要“来自不同子领域的知识”。

这听起来和人工智能已经擅长的领域一模一样。但是像最近最熟悉的那些标准大语言模型(LLM)(ChatGPT、Bard等)将没有足够的学科知识来在该领域提出合理的假设。它甚至可能会陷入“幻觉”,一些研究人员(和记者)警告说,这是与模型交互的缺点之一。

为了避免这个问题,由澳大利亚国立大学的IoanaCiucă和Yuan-SenTing领导的研究人员使用了一段称为应用程序编程接口(API)的代码,该代码是用Python编写的,称为Langchain。该API允许更高级的用户操作GPT-4等LLM,GPT-4是ChatGPT的最新基础。就研究人员而言,他们从NASA的天体物理数据系统下载了1,000多篇与银河天文学相关的科学文章,然后将其加载到GPT-4中。

美国宇航局科学家对人工智能如何将天文学提升到新水平的简短解释。图片来源:波士顿科学博物馆YouTube频道

研究人员的一项实验是测试模型获得的论文数量如何影响其得出的假设。他们注意到,仅查阅十篇论文与查阅整千篇论文所提出的假设之间存在显着差异。

但他们如何判断假设本身的有效性呢?他们做了任何有自尊的科学家都会做的事情,招募了该领域的专家。准确地说,是其中两个。他们要求他们只是基于思想的独创性、检验假设的可行性以及其依据的科学准确性来提出假设。专家们发现,即使数据集有限,只有10篇论文可供参考,Astro-GPT提出的假设(他们称之为模型)的评分也仅略低于有能力的博士。学生。通过访问完整的1,000篇论文,Astro-GPT的得分达到了“接近专家水平”。

确定向专家提出的最终假设的一个关键因素是使用“对抗性提示”对假设进行了完善。虽然这听起来很激进,但这仅仅意味着,除了开发假设的程序之外,另一个程序也接受了相同数据集的训练,然后向第一个程序提供有关其假设的反馈,从而迫使原始程序改进其假设。逻辑谬误,通常会创造出更好的想法。

即使有对抗性的反馈,也没有理由获得天文学博士学位。学生放弃在自己的领域提出自己独特的想法。但是,这项研究确实指出了这些法学硕士的能力没有得到充分利用。随着它们被更广泛地采用,科学家和外行人可以越来越多地利用它们来提出新的、更好的想法来测试。