AI의 연구 능력은 어느 정도 일까

Business News / 문광주 기자 / 2023-04-17 12:00:09
3'30"읽기
- AI Descartes는 케플러의 세 번째 행성 운동 법칙을 "재발견"했다.
- AI는 아인슈타인의 방정식 설정에 실패했지만 설명된 현상에 가장 가까운 공식 식별
- 재료가 얼마나 많은 가스 분자와 결합할 수 있는지 설명하는 공식을 개발해

연구자로서의 인공 지능
AI 시스템은 공식에 대한 사전 지식 없이 원시 데이터에 적합한 방정식을 찾는다. 


케플러의 행성 운동 법칙, 아인슈타인의 시간 팽창, 기체 분자의 거동


새로 개발된 인공 지능은 이러한 과학적 법칙을 독립적으로 "재발견"하고 올바르게 공식화했다. AI 시스템 "AI Descartes"는 정리되지 않은 원시 데이터와 물리적 배경지식을 기반으로 한다. 이로부터 시스템은 법칙에 대한 올바른 공식을 개발하지만, 편차가 있는 곳과 더 많은 데이터가 필요한 곳을 나타낸다. 

▲ 그림 1: 관련 세트 및 해당 거리의 시각화. 수치 데이터, 배경 이론 및 발견된 모델은 태양계에서 행성의 궤도 주기를 제공하는 케플러의 행성 운동 제3법칙에 대해 설명된다. 데이터는 각 행성의 태양 질량 m1, 궤도 주기 p 및 질량 m2의 측정치(m1, m2, d, p)와 태양으로부터의 거리 d로 구성된다. 배경 이론은 뉴턴의 운동 법칙, 즉 원심력, 중력 및 평형 조건에 대한 공식에 해당. 4-튜플(m1, m2, d, p)은 (m1 + m2, d, p)로 투영. 파란색 매니폴드는 fB 솔루션을 나타낸다. 회색 다양체는 발견된 모델 f의 솔루션을 나타낸다. 이중 화살표는 거리 β( f ) 및 ε( f )를 나타낸다. (출처: Combining data and theory for derivable scientific discovery with AI-Descartes / nature communications)

ChatGPT, BARD, Alphafold 또는 기타 인공 지능:

새로운 AI 시스템의 개발 도약은 분명하다. 적응형 알고리즘과 신경망은 텍스트를 작성하고 이미지를 만들거나 게임을 마스터할 수 있을 뿐만 아니라 오랫동안 연구와 과학에도 유용했다. 그들은 단백질 구조를 해독하고, 질병을 진단하고, 수학적 증거를 찾거나 화학적 합성 경로를 개발한다.

과학의 기본 원리

이제 과학적 발견의 이면에 있는 기본 원칙을 마스터하는 AI 시스템이 있다. 한편으로는 규칙성에 대한 정보를 포함하는 풍부한 데이터에서 이를 식별하고 단순한 "노이즈"와 구별하는 것이 문제다. 한편, 데이터와 기존의 배경지식을 바탕으로 완전히 새로운 관계를 인식하고 이를 방정식으로 설명하기 위해서는 지식과 직관, 과학적 창의성이 필요하다. 이 과정만이 과학의 획기적인 발전으로 이어진다.

두 가지 접근 방식 결합: 기호 회귀

하지만 인공 지능도 이것을 할 수 있을까? 이것이 바로 Cornelio와 그녀의 동료들이 알고 싶었던 것이다. 이를 위해 그들은 이미 일반적인 두 가지 접근 방식을 결합한 AI 시스템을 개발했다. 첫 번째는 AI가 사전 정의된 데이터 중에서 데이터에 가장 적합한 산술 연산을 선택하고 그로부터 수식을 컴파일하는 소위 기호 회귀다. 가장 간단한 경우 + , -, × 및 ÷로 구성된 목록일 수 있다.

그런 다음 AI 시스템은 주어진 수식 빌딩 블록에서 수백만 개의 방정식을 생성하고 어떤 것이 데이터에 가장 적합한지 확인한다. "이러한 기호 회귀 모델은 일반적으로 신경망보다 해석하기 쉽고 데이터가 덜 필요하다"고 연구원은 설명했다. "그러나 그들은 데이터에 맞는 공식과 과학적으로도 의미가 있는 공식을 식별하는 데 어려움을 겪고 있다.“
▲ AI 시스템은 두 가지 접근 방식을 결합한다. © 퍼블릭 도메인

논리적 도출

AI 시스템의 두 번째 구성 요소인 소위 "추론 시스템"이 작동하는 곳이다. 이것은 이전에 일련의 기본 과학 이론과 법칙으로 공급되었으며 이제 어떤 일치 방정식이 과학적으로도 의미가 있는지 논리적으로 도출할 수 있다. Cornelio는 "이를 통해 AI 시스템은 다양한 애플리케이션에 의미 있는 모델을 생성할 수 있다"고 말했다.

수식 할당과 논리적 검증의 조합은 또한 "AI Descartes"라는 시스템을 ChatGPT와 같은 생성 인공 지능과 구별한다. 이러한 대규모 언어 모델은 주로 교육 데이터에서 공통적인 공통 언어 패턴을 기반으로 하며 논리적으로 진행되지 않는다. 따라서 그들은 많은 수학적 과학적 질문에 실패하고 그럴듯하게 들리는 넌센스를 생성한다.

첫 번째 테스트로 케플러의 행성 궤도

그러나 AI Descartes는 얼마나 좋은가? 이를 테스트하기 위해 연구원들은 그에게 세 가지 과제를 부여했다. 정리되지 않은 데이터와 일련의 일반적인 물리적 원리를 기반으로 AI 시스템은 물리학에서 세 가지 획기적인 발견을 "재발견"하고 사전에 알지 못하는 사이에 방정식의 형태로 설명해야 한다.

첫 번째 문제로 AI 시스템은 행성의 궤도와 공전 주기를 기술하는 케플러 제3법칙을 인식해야 한다. "실험 데이터에서 이 법칙을 추출하는 것은 특히 행성의 질량이 매우 다른 크기일 때 어려운 일이다"고 과학자들은 설명했다. 그러나 그의 추론 모듈의 도움으로 AI Descartes는 물리적으로 올바른 공식을 찾았다. 케플러의 세 번째 행성 운동 법칙을 "재발견"한 것이다.
▲ AI 시스템 "AI Descartes"의 구조와 기능. © Cornelio et al./Nature Communications, CC-by 4.0

아인슈타인의 시간 지연과 랭뮤어의 흡착

두 번째 과제는 알베르트 아인슈타인의 특수 상대성 이론이 설명한 시간 팽창이었다. 빠르게 움직이는 물체의 경우 시간이 느려진다. 여기서 AI 시스템은 아인슈타인의 방정식 설정에 성공하지 못했지만 설명된 현상에 가장 가까운 공식을 식별할 수 있었다고 팀은 보고했다. 그 대가로 시스템은 여기서 Newtonian이 아니라 상대론적 물리학이 작용하고 있음을 올바르게 인식했다.

세 번째 작업으로 AI 시스템은 화학자 Irving Langmuir가 표면에 기체 분자를 흡착하기 위해 개발한 공식을 찾아야 했다. 이를 위해 AI Descartes는 운모에 대한 메탄과 실리칼라이트에 대한 이소부탄의 흡착에 대한 실험 데이터와 고체가 가스에 "도킹 포인트"를 제공한다는 지식을 받았다. 이를 바탕으로 AI 시스템은 테스트 조건에서 재료가 얼마나 많은 가스 분자와 결합할 수 있는지 설명하는 공식을 개발할 수 있었다.

시작일 뿐

Cornelio와 그녀의 동료에 따르면 AI Descartes와 같은 AI 시스템은 과학적 데이터 분석을 지원하는 새로운 가능성을 열어준다. "우리 작업의 가장 흥미로운 측면 중 하나는 과학을 크게 발전시킬 수 있는 잠재력이다"고 Cornelio는 말했다. 다음 단계로 팀은 AI 시스템이 과학 기사를 독립적으로 읽고 관련 이론을 추출하여 배경 지식을 독립적으로 학습할 수 있는 능력을 부여할 계획이다.

메릴랜드 대학의 공저자 타일러 조셉슨(Tyler Josephson)은 "지금까지 우리는 공리를 형식적이고 기계가 읽을 수 있는 언어로 번역할 사람이 필요했다"고 설명했다. 그는 "미래에 우리는 과학과 기술의 더 많은 영역을 다루기 위해 시스템의 이 부분을 자동화하고 싶다"고 말했다.
(Nature Communications, 2023; doi: 10.1038/s41467-023-37236-y)
출처: 메릴랜드 대학교

[더사이언스플러스=문광주 기자]

[ⓒ the SCIENCE plus. 무단전재-재배포 금지]