banner
홈페이지 / 소식 / AI 로봇 '프리다(FRIDA)'는 그림을 그릴 수 있다. 하지만 그것이 예술을 만드는 것인가?
소식

AI 로봇 '프리다(FRIDA)'는 그림을 그릴 수 있다. 하지만 그것이 예술을 만드는 것인가?

Aug 14, 2023Aug 14, 2023

광고

지원 대상

정신

카네기 멜론 대학의 연구원들은 추상적인 아크릴을 칠할 수 있는 AI 기반 팔을 개발했습니다. 예술인가요?

올리버 왕

더 많은 오디오 저널리즘과 스토리텔링을 원하시면 뉴스 구독자에게 제공되는 새로운 iOS 앱인 New York Times Audio를 다운로드하세요.

최근 어느 날, 피츠버그의 스쿼럴 힐(Squirrel Hill) 근처에 있는 진 오(Jean Oh)의 연구실 테이블 위에서 로봇 팔이 캔버스 위에서 바쁘게 움직이고 있었습니다. 천천히 공기가 점성 있는 것처럼 팔레트 위의 연한 회색 페인트 웅덩이에 브러시를 담그고 회전하여 캔버스를 쓰다듬으며 다른 브러시 스트로크 사이에 1인치 길이의 표시를 남겼습니다. 그런 다음 마치 자신의 작업을 평가하려는 듯 뒤로 물러나 잠시 멈췄습니다.

대부분 회색 음영으로 이루어진 획은 추상적인 것, 즉 개미집을 암시했습니다. 카네기멜론대학 로봇지능그룹장 오 박사는 '우리 가운데 예술가가 있다(There Are Artists Between Us)'라는 문구가 적힌 스웨트셔츠를 입고 흐뭇한 표정으로 지켜봤다. 그녀의 박사과정 학생인 Peter Schaldenbrand가 옆에 섰습니다.

로봇 비전과 자율 항공 분야의 주제를 포함하는 오 박사의 작업은 종종 시뮬레이션과 현실의 격차, 즉 시뮬레이션 환경에서 훈련된 기계가 현실 세계에서 어떻게 작동할 수 있는지에 대해 다룹니다. 최근 몇 년 동안 Schaldenbrand 씨는 Stable Diffusion과 같은 정교한 이미지 생성 프로그램과 그림 및 그림과 같은 물리적 예술 작품 사이의 시뮬레이션과 실제 간 격차를 해소하려는 노력을 주도해 왔습니다. 이것은 주로 FRIDA라는 프로젝트에서 나타났습니다. 이 프로젝트의 최신 버전은 연구실 한구석에서 리드미컬하게 맴돌고 있었습니다. (FRIDA는 Framework and Robotics Initiative for Development Arts의 약어이지만 연구자들은 그것이 무엇을 의미하는지 결정하기 전에 Frida Kahlo에서 영감을 받아 약어를 선택했습니다.)

오 박사는 로봇이 "실제 세계의 소음"을 설명해야 하기 때문에 언어 프롬프트에서 픽셀화된 이미지, 붓질로 이동하는 과정이 복잡할 수 있다고 말했습니다. 그러나 FRIDA 개발에 도움을 준 Schaldenbrand 씨와 Carnegie Mellon의 로봇공학자 Jim McCann 씨는 이 연구가 두 가지 이유로 추구할 가치가 있다고 믿습니다. 인간과 기계 사이의 인터페이스를 개선할 수 있고 예술을 통해 사람들을 서로 연결합니다.

McCann 박사는 ChatGPT 및 DALL-E와 같은 도구를 구동하는 대규모 언어 모델을 언급하면서 “이러한 모델은 모든 사람의 데이터를 기반으로 훈련됩니다.”라고 말했습니다. "그래서 저는 아직도 그러한 모델을 사용하는 이와 같은 프로젝트가 어떻게 사람들에게 가치를 다시 전달할 수 있는지 알아내고 있다고 생각합니다."

시뮬레이션과 실제의 격차는 로봇 공학자와 컴퓨터 엔지니어에게 놀라울 정도로 까다로운 문제를 제공합니다. 일부 인공 지능 시스템은 걷기와 관련된 단계(사두근을 조이고 경골 뒤쪽을 구부림, 체중을 뒤로 기울이고 대둔근을 긴장)를 나열하고 가상 세계에서 시뮬레이션된 신체 걷기를 만들 수 있습니다. 따라서 이러한 시스템이 현실 세계에서 육체를 쉽게 걷게 할 수 있다고 생각하기 쉽습니다.

별로. 1980년대 컴퓨터 과학자 한스 모라벡(Hans Moravec)은 AI가 복잡한 추론에 참여하고 방대한 양의 데이터를 구문 분석하는 데는 능숙하지만 물병을 집는 것과 같은 간단한 신체 활동에는 좋지 않다고 지적했습니다. 이것은 Moravec의 역설로 알려져 있습니다. (인간의 신체적 우월성은 우리 몸의 오랜 진화 역사로 설명될 수 있습니다. 우리에게 단순한 작업은 수백만 년의 다윈주의 실험에 의해 뒷받침됩니다.)

고개념적인 아이디어와 기본적인 물리적 행위를 혼합하는 회화는 역설을 부각시킨다. 인간 의식의 부조리를 어떻게 팔의 움직임으로 포착할 수 있을까?

Midjourney, DALL-E 및 Stable Diffusion과 같은 AI 이미지 생성 도구는 신경망에 대규모 이미지 데이터베이스와 해당 텍스트 설명을 제공하여 훈련됩니다. 프로그래밍된 목표는 단어의 의미와 이미지의 특징 사이의 관계를 모델링한 다음 "확산 모델"에서 이러한 관계를 사용하여 특정 설명의 의미를 유지하는 원본 이미지를 만드는 것입니다. (“공원에서 소풍하는 가족”이라는 메시지는 사용할 때마다 새로운 이미지를 생성하며, 각각의 가족이 공원에서 소풍하는 것으로 이해될 것입니다.)