밀리터리 관련 보도 및 소식이 올라오는 게시판입니다.
기타

DARPA가 AI로 '전략적 혼돈'을 길들이는 3가지 방법

폴라리스 폴라리스 78

0

0
출처 https://breakingdefense.com/2023/09/thre...s-with-ai/

체스는 세계에서 가장 오래된 전쟁 게임으로, 컴퓨터는 1997년에 체스를 마스터했다. 실제 전쟁은 훨씬 더 복잡하며, 기계는 여전히 이를 이해하기 위해 고군분투하고 있다. 따라서 오늘날의 AI를 구동하는 머신러닝 기술은 64개의 정사각형에서 16개의 동일한 말들로 구성된 두 군대가 싸우는 체스에서 승리하기 위해 숫자를 분석할 수는 있지만, 실제 전투의 모호함과 혼란을 감당할 수는 없다.


이는 육상, 해상, 공중, 우주, 사이버 공간에서 수십 척의 함정, 수백 대의 항공기, 수천 명의 병력이 기동하는 합동 전 영역 작전을 조정하는 인간 지휘관을 돕기 위해 AI 기반 '전투 관리' 보좌관을 원하는 국방부에게 큰 문제다. 따라서 국방부의 장기적이고 수익성이 높은 연구를 위한 공식 기관인 DARPA는 올해 초 3개 기업과 계약을 맺고 머신러닝을 넘어 차세대 AI로 나아가기 위해 노력했으며, 이는 적어도 이론적으로는 DARPA가 "전략적 혼돈"이라고 부르는 상황에 질서를 가져오는 데 도움이 될 수 있다.


"JADC2[합동 전 도메인 명령 및 제어]는 많은 계획이 필요합니다."라고 DARPA 프로그램 매니저인 Aaron Kofford는 말했다. "이것이 바로 SCEPTER의 핵심입니다."


SCEPTER는 계획, 전술, 실험 및 복원력을 위한 전략적 카오스 엔진의 약자로, 여기서 '엔진'은 체스 엔진으로 알려진 게임 플레이 프로그램에서 의도적으로 고개를 끄덕이는 것이라고 코퍼드는 Breaking Defense와의 인터뷰에서 설명했다.


"저는 체스 선수입니다."라고 코포드는 말하며 체스 AI로부터 배울 점이 많다고 말합니다. 최신 체스 엔진은 인간 플레이어를 이길 수 있을 뿐만 아니라 게임을 분석하고 해설하며 더 나은 수를 조언함으로써 플레이어를 도울 수 있다고 그는 강조했다. 이와 유사한 전쟁용 AI 도구는 지휘관과 참모들이 군사 작전을 계획하는 데 도움을 준다.


"이것은 인간을 대체하는 것이 아닙니다."라고 그는 강조했다. "이것은 인간을 위한 도구입니다." (이는 마치 졸처럼 모든 것을 통제하는 스카이넷 스타일의 AI가 아니라 인간과 기계의 공생을 선호하는 국방부의 오랜 정책과 전략 문화에 부합하는 것입니다.) "우리는 인간이 상황을 평가하는 데 도움이 되는 도구를 개선하기 위해 노력하고 있습니다."


"노력 중"이라는 표현은 매우 적절합니다. 코포드는 "우리는 아직 '이게 가능할까'라는 단계에 있습니다."라고 솔직하게 인정했다. "이것은 꽤 미친 아이디어입니다."


왜 그럴까? 체스와 같은 게임은 코포드의 표현을 빌리자면 "경계가 잘 잡혀 있기" 때문에 컴퓨터가 잘 할 수 있다. 가능한 총 포지션의 수는 사실상 무한대에 가깝지만, 각 플레이어가 각 턴에서 선택할 수 있는 선택지는 극명하게 제한되어 있고 명확하게 정의되어 있다. 따라서 알고리즘은 잠재적인 경로를 단계별로 탐색한 다음 승리로 이어질 가능성이 높은 분기 경로와 패배로 이어지므로 잘라내야 하는 분기 경로를 계산할 수 있다. (전문 용어는 "몬테카를로 트리 검색"이다).


그러나 전투에 임박했거나 막 본거지를 떠나 전선으로 이동하는 군대의 경우, 가능한 '다음 행동'의 수는 8×8 격자보다 훨씬 더 많고 정밀하게 측정할 수 없다. 아침에 일어나는 평범한 민간인의 경우에도 "커피를 만든 다음 출근하기", "출근 후 커피 마시기", "직장을 그만두고 모든 재산을 팔아 네팔의 코뮌에 들어가기" 등 사소한 선택부터 급진적인 선택까지 헤아릴 수 없을 정도로 많은 선택지가 있다.


"제가 다음에 할 수 있는 일은 무한히 많습니다."라고 코포드는 말하며, 이를 위해서는 무한한 가능성을 기계가 관리할 수 있는 것으로 줄여야 한다고 말했다.


그러기 위해서는 기계 학습 이전의 아이디어, 즉 오늘날에도 세금 준비부터 의료 진단에 이르기까지 모든 분야에 사용되는 소위 전문가 시스템이라고 불리는 DARPA의 '제1세대 AI'로 돌아가야 한다는 것이 밝혀졌다. 방대한 데이터에 알고리즘을 적용하고 상관관계를 찾기 위해 시행착오를 거치는 대신, 지식이 풍부한 사람, 즉 전문가가 기계가 따라야 할 일련의 옵션과 규칙을 정의하는 것부터 시작한다.


코포드는 "전문가 지식을 적용하면 더 중요한 공간을 빠르게 검색할 수 있다고 생각합니다."라고 말하며 "인간의 개별적인 사고나 집단적인 인간 협의회보다 더 빠르게 검색할 수 있습니다."라고 덧붙였다.


목표는 구식 전문가 시스템에서와 같이 우주에 대한 인간의 이해와 최신 머신 러닝에서와 같이 빅데이터를 처리하는 컴퓨터 속도의 시너지 효과를 통해 두 가지의 장점을 모두 얻는 것이다. 그러나 전투에서 의사 결정 트리를 사용하는 것과 마찬가지로 최종 결과에 도달하는 방법에 대한 여러 가지 아이디어가 있으며, DARPA는 다양한 접근 방식에 열려 있다. 따라서 DARPA는 세 가지 다른 경로를 탐색하기 위해 리서치 회사인 찰스 리버 애널리틱스, 비영리 단체인 패러랙스 어드밴스드 리서치, 거대 기업인 BAE 시스템즈와 세 차례에 걸쳐 SCEPTER에 대한 계약을 체결했다.


상징적 추론: 인간이라면 어떻게 할까?


평범한 사람들은 아무리 똑똑한 기계도 당황하게 만드는 일상적이고 현실적인 혼란에 어떻게 대처할까? 찰스 리버의 과학자 마이클 해라돈은 "적어도 인간에게는 이러한 문제를 해결할 수 있는 이유는 인간이 항상 휴리스틱 또는 근사치라고 할 수 있는 큰 가방을 적용하고 있기 때문입니다."라고 Breaking Defense에 말했다. "가능한 모든 것을 고려할 필요는 없습니다."


예를 들어, 운전 중 방향을 결정할 때 0도에서 180도까지 가능한 모든 각도를 계산하는 것이 아니라 일반적으로 좌/우/직진만 선택한다. 세금 신고서 작성 소프트웨어는 세금 신고서를 작성할 때 1040 양식의 모든 항목에 가능한 모든 숫자를 무작위로 할당하고 머신러닝을 적용하여 어떤 조합이 세무 감사를 받을 가능성이 낮은지 파악하는 것이 아니라, 전문가가 미리 프로그래밍한 엄격한 규칙을 따른다고 Harradon은 설명한다.


"논리적으로 무언가를 추론할 때, 체크리스트를 작성할 때, 계획을 세울 때 모두 상징적 추론의 한 형태입니다."라고 해라돈은 설명했다. 컴퓨터는 체크리스트를 만드는 데 어려움을 겪을 수 있지만, 일단 체크리스트가 만들어지면 사람보다 훨씬 빠르게, 심지어 모든 가능성을 계산하는 머신러닝 알고리즘보다 더 빠르게 체크리스트를 확인할 수 있다.


그렇다면 전투를 계획하기에 충분한 체크리스트를 어떻게 만들 수 있을까요? 해라돈은 이 부분이 까다롭다고 인정한다. 휴리스틱만 사용하거나 머신러닝만 사용하는 대신 "두 가지의 장점을 모두 취"하여 결합하고, 각각 피드백을 통해 서로를 개선해야 한다고 그는 말했다. 어떤 분야에서는 사람이 휴리스틱을 입력하여 대량의 데이터를 길들일 수 있고, 다른 분야에서는 알고리즘이 데이터를 분석하고 상관관계를 찾아내고 자체적인 경험 법칙을 추론할 수 있다.


해라돈은 "이 분야는 아직 초기 단계에 불과하다"고 인정하면서도 "찰스 리버가 아직 공유할 준비가 되지 않은 일부 사내 연구를 포함하여 정말 좋은 데모들이 많이 있다"고 말했다.


인과 네트워크: 머펫 위에 앉은 작은 미스 머펫


인간의 전문 지식과 컴퓨터 계산을 결합하는 찰스 리버의 단순한 방법과는 달리, Parallax의 접근 방식은 거의 기발하다. 사람들이 순서도 형식으로 AI에게 이야기를 들려주는 것이다.


동요로 유명한 미스 머펫을 예로 들어보자고 Parallax의 과학자 반 파루낙은 인터뷰에서 말했다. 머펫 양이 터펫에 앉아 머펫 양을 상징하는 커드와 유청(코티지 치즈의 일종)을 먹고 있는데 거미가 나타난다면 머펫 양은 도망갈까? 계속 먹을까? 거미를 부숴버릴까? 거미를 잡아먹을까? (마지막 옵션은 5학년 때 파루낙에게 처음 등장했다). 이론적으로는 머펫 양이 선택할 수 있는 옵션이 무한대이지만(컴퓨터도 분석하기에는 너무 많음), 실제로는 상황에 맞는 그럴듯하고 적절한 반응의 수가 한정되어 있다.


이러한 각 반응은 차례로 새로운 상황으로 이어지고, 새로운 가능한 옵션 - 이제 거미가 도망치려 할까? - 더 많은 옵션이 있는 더 많은 상황으로 이어진다. 이렇게 비교적 간단한 옵션들을 단계별로 연결하면 공식적으로 "인과 네트워크"라고 하는 정교한 가능성 지도가 완성된다.


컴퓨터 프로그래머는 이미 이런 종류의 스토리 플로우차트를 항상 사용합니다: 많은 롤플레잉 게임의 기본 골격이다. 파루낙은 가능한 모든 옵션을 분석하는 대신 "플레이어가 특정 상태에 있을 때 다음에 무엇을 할 수 있는가?"로 문제를 단순화하면 된다고 말했다.


"컴퓨터 프로그래머는 아니지만 상자와 화살표를 그리는 것을 좋아하는 군인들에게도 큰 잠재력을 가지고 있습니다."라고 그는 말했다. "저는 IC(정보 커뮤니티)에서 많은 사람들을 만났는데, 그들이 시나리오를 설명하려고 할 때마다 가장 먼저 종이를 꺼내거나 화이트보드로 걸어가서 상자와 화살표를 그리기 시작하곤 했습니다."


물론 이러한 옵션 순서도는 머펫 양의 순서도보다 더 복잡하고 그리는 데 더 많은 전문 지식이 필요하다. 일반인에게는 공개할 수 없는 Parallax의 군사 시나리오 중 하나는 퇴역한 공군 원사가 작성한 것으로, 거의 천 개의 개별 이벤트가 포함되어 있다.


좋은 소식? 이러한 군사 전문가들은 플로우차트를 그리기 위해 코딩을 배울 필요가 없다. 더 좋은 소식? AI는 플로차트를 분석하기 위해 플로차트의 스토리를 이해할 필요 없이 이벤트 A에 B1, B2, B3 등의 상황으로 이어지는 A1, A2, A3 등의 옵션이 있다는 것만 이해하면 된다. 각 상황에 양수 값과 음수 값을 추가하여 컴퓨터가 어떤 상황을 추구하고 어떤 상황을 피해야 하는지 알 수 있도록 한 다음, 알고리즘을 느슨하게 설정하여 가능성을 반복해서 탐색하고 사람이 순서도를 보면 알 수 있는 최적의 경로를 학습한다.


"파루낙은 "이는 매우 간단한 의사 결정 과정이며, AI가 상관관계를 파악하기에 충분한 데이터를 확보할 때까지 반복해서 매우 빠르게 실행할 수 있습니다."라고 말한다.


맞춤형 추상화: 시뮬레이션 시뮬레이션


체스 엔진의 한 가지 교훈은 인공지능이 게임을 충분히 반복해서 플레이하게 하면 인간만큼, 또는 인간보다 더 잘 플레이하는 법을 배울 수 있다는 것이다. 체스는 너무 단순해서 현실적인 워게임이 될 수 없지만, 실제 무기 시스템에 대한 상세한(종종 기밀로 분류된) 데이터를 사용하여 국방부를 위해 특별히 개발된 더 나은 시뮬레이션이 많이 있다고 BAE의 과학자 마르코 프라비아는 Breaking Defense에 말했다.


프라비아는 인터뷰에서 "사람들이 수십 년 동안 많은 시간을 들여 다듬어온 방대한 시뮬레이션 라이브러리가 이미 존재하며, 기획자들은 이미 이 라이브러리를 유용하게 사용하고 있습니다."라고 말했다. 따라서 체스 봇에게 승리하는 방법을 훈련시키기 위해 시뮬레이션 체스 게임을 실행하는 대신, AI가 어떤 선택 패턴이 성공으로 이어지는지 알 수 있을 때까지 군사 전용 시뮬레이터를 반복해서 실행하는 것이다.


물론 프라비아는 한 가지 문제가 있다고 인정했다: 이러한 군사 시뮬레이션은 체스보다 훨씬 더 복잡하기 때문에 실행하는 데 훨씬 더 많은 컴퓨팅 성능이 필요하다. 인공지능이 특정 움직임과 체크메이트 사이의 통계적 상관관계를 학습할 때까지 수백만 번의 시뮬레이션 체스 게임을 실행하면서 무차별적인 시행착오를 통해 체스 게임을 학습할 수 있지만, 군사 시뮬레이션에서는 그렇게 할 수 없다.


그래서 BAE는 지름길을 택했다: 바로 시뮬레이션을 실행하는 것입니다. 군사 시뮬레이터를 실행하면 AI가 분석할 수 있는 데이터가 생성된다. AI에게 이 데이터를 충분히 제공하면 필수적인 역학 관계는 포착하되 사소한 세부 사항은 추상화한 원본 시뮬레이션의 단순화된 버전을 생성할 수 있다. BAE가 '맞춤형 추상화'라고 부르는 이 단순화된 시뮬레이션 시뮬레이션은 실행에 훨씬 적은 컴퓨팅 성능을 필요로 하므로 반복해서 실행하여 머신러닝 알고리즘이 해당 결과를 분석할 수 있는 충분한 데이터를 생성할 수 있다.


하지만 원본 시뮬레이션을 '맞춤형 추상화'로 단순화할 때 필수적인 세부 사항이 아닌 사소한 세부 사항만 제거되는지 어떻게 알 수 있을까? 이는 전문가가 판단해야 하는 문제라고 프라비아는 인정했다.


본질적으로 AI와 인간의 전문 지식이 겹겹이 쌓인 케이크다: 인간은 기본 시뮬레이션을 만들고, AI는 시뮬레이션의 시뮬레이션을 생성하며, 인간은 특정 목적에 맞게 이러한 맞춤형 추상화를 조정한다.


DARPA는 이 세 가지 접근 방식 중 어느 것이 효과가 있는지 어떻게 평가할까요? 그 결과를 다시 인간에게 피드백하는 것이다.


코포드는 "[군사] 계획 전문가들이 결과물을 보고 '실제로는 유용했다'고 말하도록 하고 있습니다."라고 말했다: "궁극적으로 우리가 시간을 낭비하고 있는지, 아니면 도움을 주고 있는지를 알려주는 것은 기획자의 몫입니다."
 

신고
0




    


댓글 쓰기 권한이 없습니다. 로그인

취소 댓글 등록

신고

"님의 댓글"

이 댓글을 신고하시겠습니까?

댓글 삭제

"님의 댓글"

삭제하시겠습니까?

목록
번호 분류 제목 글쓴이 날짜 추천 조회
공지 2023년 하반기 개편 안내 (레벨 시스템 추가) 9 Mi_Dork 23.07.13.09:07 +1 4338
공지 밀리돔 후원 요청 (2023-06-23) 28 운영자 14.01.24.20:42 +13 39188
25104 공중체계
normal
폴라리스 23.10.17.22:41 0 223
25103 기타
normal
폴라리스 23.10.17.22:37 0 122
25102 기타
image
폴라리스 23.10.17.09:55 0 268
25101 기타
image
폴라리스 23.10.16.23:30 0 186
25100 육상체계
normal
폴라리스 23.10.16.23:28 0 264
25099 기타
normal
폴라리스 23.10.16.23:27 0 70
25098 공중체계
normal
폴라리스 23.10.16.23:26 0 60
25097 기타
normal
폴라리스 23.10.16.23:26 0 102
25096 해상체계
normal
폴라리스 23.10.16.23:26 0 269
25095 공중체계
normal
폴라리스 23.10.16.23:25 0 111
25094 육상체계
normal
폴라리스 23.10.16.23:25 0 394
25093 해상체계
normal
제너럴마스터 23.10.16.12:15 0 522
25092 해상체계
normal
폴라리스 23.10.14.18:01 0 410
25091 전략
normal
폴라리스 23.10.14.18:01 0 181
25090 전략
normal
폴라리스 23.10.14.18:00 0 188
25089 육상체계
normal
폴라리스 23.10.14.18:00 0 106
25088 기타
normal
폴라리스 23.10.14.17:59 0 259
25087 전략
normal
폴라리스 23.10.14.17:59 0 75
25086 공중체계
normal
폴라리스 23.10.14.17:58 0 123
25085 기타
normal
폴라리스 23.10.14.17:56 0 282

밀리돔 | milidom 의 저작물은 다음의 사이트 이용 약관 에 의거해 이용 가능합니다.
이 라이선스의 범위 이외의 이용허락은 운영진에게 문의 하시기 바랍니다.