메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

IT/모바일

AI 기술 발전의 세 가지 특징: 속도, 무경계 그리고 창의성

한빛미디어

|

2024-07-30

|

by 오카노하라 다이스케

4,019

 

이 책은 제가 2015년 7월부터 『닛케이 로보틱스 Nikkei Robotics 』지에 매달 연재했던 글을 모아 편집해 만들었습니다. 매일 읽는 논문과 보고 듣는 뉴스 중에서 중요한 주제를 선택하여 작성해왔죠.


AI 분야는 발전 속도가 빠른 만큼 속보성이 중요합니다. 가장 빨랐던 사례를 하나 들자면, 중요한 논문이나 연구 결과가 공개된 직후 하루 안에 글을 써서 2주 이내에 지면에 게재했던 적도 있습니다. 일반 대중을 위한 기사로서는 웹 기사까지 포함하여 일본뿐 아니라 세계에서 가장 빨랐을 것이라 자부합니다.


최근 AI 분야의 발전은 놀랍습니다. 

 

알렉스넷의 구조 / 출처: ImageNet Classification with Deep Convolutional Neural Networks

지난 2012년, 알렉스넷AlexNet 이라는 신경망이 일반 물체 인식 대회 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)에서 압도적 격차로 우승하면서 주목받은 이른바 ‘알렉스넷 모멘트’가 일어났습니다. 이후 전 세계 연구자와 기업들이 급속하게 AI에 주목하기 시작했고, 이어서 거의 매년, 매달 세상을 놀라게 하는 성과들이 등장해 왔습니다. 『AI 딥 다이브』에서 다루는 기사들은 그러한 성과의 대부분을 거의 실시간으로 전달했습니다.

 

DALL-E:2 구조 (출처: 원 논문)


이러한 연구와 성과들은 갑자기 나타난 것이 아니라 초기 단계의 연구와 노력으로부터 차근차근 연속적으로 발전해 왔습니다. 예를 들어, 2022년 봄에 등장한 달리2 DALL·E 2 와 이매진 Imagen 은 텍스트로부터 이미지를 매우 충실하고 표현력 있게 생성함으로써 세상을 놀라게 했습니다. 여기에 사용된 확산 모델 Diffusion based probabilistic model 에 필요한 기술들은 점진적으로 발전해 왔습니다. 

 

2014년의 변분 오토인코더(VAE), 2017년의 VW Variational Walkback, 2018년의 Neural ODE 등인데, 이보다 더 원류를 찾아 올라가자면 1995년에 등장한 헬름홀츠 머신에 이릅니다. 이러한 선구적인 연구들의 결과만 봤을 때는 실용화와 거리가 있었지만, 연구자 관점에서는 미래 가능성이 보였던 흥미로운 연구였으며 그만큼 착실하게 발전해 왔습니다. 앞서 언급한 기법들(VAE, VW, Neural ODE)이 막 등장했지만 아직 세상의 주목을 받지 못하던 단계에서부터 저는 그 모두를 연재 기사로 다루어 왔습니다.


아직 실용화에는 이르지 못했지만 주목받는 기술들도 많이 다뤘습니다. 예를 들어, NeRF Neural Radiance Field 등에 의한 새로운 시점에서의 장면 생성 기술은 앞으로 현실 세계에 AI를 도입하는 데 매우 큰 영향을 미치리라 여겨집니다. 또한 SLAM과 같은 자세 추정/공간 복원 기술은 이미 로봇 등에 널리 쓰이고 있지만, 이 책에서 다룬 기술은 이러한 기법들을 더 높은 정확도로 어려운 환경에서 빠르게 처리할 수 있는 방식입니다. 메타버스나 디지털 트윈처럼 현실 세계와 가상 세계의 경계가 점차 사라지는 가운데, 이러한 기술들은 두 세계를 연결하는 접착제 역할로서 중요해질 것입니다.


강화 학습을 통한 최적 제어 또한 주목받고 있지만 아직 현실 세계에 큰 영향을 미치지 못하는 분야 중 하나이죠. 강화 학습의 실용화에서 중요한 문제로는 대량의 시행착오가 필요하다는 점을 꼽을 수 있습니다. 이 책에 소개된 월드 모델, 시뮬레이션과의 융합이 더욱 발전하면 더욱 넓은 분야에서 활용될 것으로 기대됩니다.

 

AI 기술 발전의 세 가지 특징은 속도, 무경계(Borderless), 창의성이다. (출처:『AI 딥 다이브』, 오카노하라 다이스케 지음)

 

AI 기술 발전에는 다음과 같은 세 가지 특징이 있다고 생각합니다. 속도, 무경계borderless 그리고 창의성입니다.


첫 번째 특징은 ‘속도’입니다. 

현재의 AI 기술은 논문이나 코드가 순식간에 전 세계에 공유되고, SNS에서 바로 논의가 시작되며, 유튜브에는 이를 설명하는 영상이 등장합니다. 기술에 큰 영향을 미치는 연구가 등장한다면, 순식간에 커뮤니티에 퍼지고 1개월 후 후속 연구가 등장하기 시작하며, 6개월 내지 1년이 지난 뒤에는 학회에 해당 연구를 활용한 기법의 논문이 등장합니다. 처음 방법을 제안한 논문과 그 후속 연구, 그리고 후속 연구의 후속 연구가 같은 학회의 같은 세션에서 발표되는 경우도 드물지 않습니다. 이러한 속도감도 『AI 딥 다이브』에서 함께 전달하고자 합니다.


두 번째 특징은 ‘무경계’입니다.

지금의 AI는 특정 분야 전용 기법이라는 것이 없고 한 분야에서 성공한 방법이 곧바로 다른 분야로 퍼져 나간다는 의미입니다.

 

예를 들어 딥러닝 자체는 처음에는 음성 인식 분야에서 성공했습니다. 대규모 데이터로 학습하면 다양한 기법 없이도 학습이 성공하여 높은 성능을 발휘할 수 있었습니다. 이결과를 이미지 인식에도 적용할 수 없을까라는 생각에 2012년 알렉스넷이 등장했습니다. 이 연구 성과는 시간 차이는 있지만 그 후 자연어 처리나 화합물 등 다른 분야에 도입되었습니다. 

 

마찬가지로 자연어 처리(기계 번역) 분야에서 처음 등장한 트랜스포머 Transformer 역시 이미지 인식 등 다른 분야로 순식간에 퍼져 나갔습니다. 이러한 기법들의 적용 분야에 경계가 없다는 것은, 자연계에 어떤 공통된 법칙성이 있는 것이 아닐지 생각하게 만듭니다.


마지막 특징은 ‘창의성’입니다.  

AI 기술의 발전에 있어서 영향력 있는 성과는 상식이나 기존 지식에서 벗어난 곳에서 등장한다는 의미입니다. 

 

뛰어난 직관과 실험 능력을 기반으로 놀라운 결과가 나타나고, 얼마 후 그것을 설명할 수 있는 이론이 등장하는 흐름이 이어지고 있습니다. 이러한 결과를 볼 때마다 기술 발전을 방해하는 가장 큰 요인은 창의성의 부족이며 상식에 얽매이지 않는 유연한 발상이 필요하다는 생각이 듭니다. 이 책을 통해 이러한 유연한 발상들도 보셨으면 합니다.

 

그동안 여러 분께 오류나 코멘트를 피드백 받았지만, 책의 내용에 오류 등이 있다면 필자인 저의 책임입니다. 연재 당시의 분위기를 전달하기 위해 내용은 연재 당시의 표현을 최대한 유지하고자 했습니다. 이 책을 통해 AI 기술의 최전선에서 어떤 일이 일어나고 있는지 파악하고 흥미를 느끼게 되신다면 저자로서 기쁘겠습니다.


위 콘텐츠는 『AI 딥 다이브』에서 내용을 발췌하여 작성하였습니다.

AI 딥 다이브

댓글 입력
자료실

최근 본 상품0