본문바로가기
  • BUSINESS
  • PRODUCT
  • CUSTOMER
  • COMMUNITY

제 목 마이크로소프트 이그나이트 2021를 통해 본 인공지능 기술 혁신
등록일 2021-04-13
첨부파일


<사진 출처 : freepik.com>


 

마이크로소프트, 구글, 페이스북, 아마존, 애플 같은 거대 IT 기업의 테크 컨퍼런스는 각 기업의 새로 운 제품과 기술을 볼 수 있다는 것도 있지만 우리가 관심 갖는 여러 기술의 미래 방향을 살펴볼 수 있 다는 의미가 있다. 마이크로소프트 이그나이트 2021은 마이크로소프트가 제시하는 클라우드, 인공지능, 기술과 사회 이 슈를 논의하는 대규모 행사이고 올해에는 온라인 행사로 열렸다. 3월 2일부터 48시간 동안 15만 명의 전문가, 관리자, 개발자들이 디지털로 참석했다. 사티아 나델라 CEO는 기조 연설에서 우리 삶을 완전히 바꿔버린 클라우드의 다음 단계 그리고 생활환경 지능(Ambient Intellig), 창작자와 커뮤니티, 경제 적 기회, 신뢰 기반의 기술이 이끌어 낼 혁신을 강조했다. 이번 글에서는 이그나이트 2021에서 소개한 마이크로소프트에서 개발하거나 연구 중인 인공지능 기 술을 살펴보면서 인공지능의 혁신과 진화 방향을 바라보고자 한다. 마이크로소프트의 인공지능과 혁신을 총괄하는 수석 부사장 미트라 아지지라드(Mitra Azizirad)의 발표가 이번 이그나이트에서 마이크로소프트 인공지능 기술 혁신의 핵심 내용이다.

영화를 이해하는 VinVL(Visual features in Vision-Language)과 프로젝트 튜링 의 결합

마이크로소프트 연구소에서 발표한 매시브 비주얼 언어 모델로 애저 코그니티브 서비스와 애저 오픈 소스로 제공한다. 전형적인 비전-언어(VL) 시스템은 VL 이해를 위해 두 개의 모듈, 즉 이미지 인코딩 모 듈과 비전-언어 융합 모듈을 사용한다. 이미지 인코딩 모듈은 시각 특질(feature) 추출기로 입력 이미지 의 특질 지도를 CNN 모델을 사용해 생성한다. 마이크로소프트는 비주얼 지놈(Visual Genome) 데이터 셋으로 학습한 모델을 보통 사용한다. 비전-언어 융합 모듈은 인코딩한 이미지와 텍스트를 시맨틱 공간에 매핑해서 의미적 유사성을 계산하 는데 마이크로소프트에서는 오스카(OSCAR)와 같은 트랜스포머 기반 모델을 사용해서 구현한다. 이번 이그나이트에서는 마이크로소프트 인공지능과 혁신부문 GM인 데이빗 카모나(Carmona)가 영화 ‘어벤저스 엔드게임’ 영상을 갖고 인공지능이 영화를 이해하는 수준을 데모했다. VinVL과 또 하나의 대 형 언어 모델인 마이크로소프트 튜링1)을 이용해 우리가 원하는 내용이 있는 장면을 찾고 그 장면 내용 의 요약을 보였다. 또한, 영화 내용에 대해 질문을 던지거나 (예를 들어, 타노스가 사용한 제스처는 무엇인가?), 특정 지점에서 요약을 갖고 튜링이 이야기의 나머지를 예측할 수도 있음을 보였다.  때로는 이런 기능이 영화의 또 다른 결말을 보여줄 수 있음을 선 보였다.
 

AI at Scale

마이크로소프트의 인공지능 서비스가 대규모에서도 지원이 가능함을 제시하는 것으로 기존 애저의 코 그니티브 서비스가 이제 인공지능 슈퍼컴퓨터를 기반으로 동작하며 다양한 새로운 대형 모델을 지원하고 있음을 제시했다. 마이크로소프트는 이 표현을 타사와의 차별성을 갖는 특징으로 매우 전략적인 메시지 로 전달하고 있다. 오픈AI의 GPT-3가 이 슈퍼컴퓨터를 이용한 대표적인 모델이며, 서비스 레이어에서는 강화 지식이나 협동 추론이 지원되며 여기에는 튜링 모델이 사용된다. KPMG 같은 기업이 이를 사기 탐지에 사용하고 있음을 보이고, 대형 모델을 좀 더 활용해 고객 지원에 사용하는 AvePoint 사례를 소개했다.


<사진 출처 : freepik.com>



 

머신 티칭(Machine Teaching)

기본 학습이 되어 있는 인공지능 시스템에 고객이 알고 있는 전문 영역의 지식을 이용해 목적을 특정 하거나, 레슨을 학습하거나 안전 기준을 배우도록 할 수 있다. 이 방식은 이미 2019년부터 마이크로소 프트가 사람들이 갖고 있는 전문지식을 인공지능에게 가르치는 전략이다. 사람들의 문제를 좀 더 쉬운 과업을 나눈 다음에 머신 러닝 모델에게 솔루션을 더 빠르게 찾을 수 있는 중요한 단서를 제공한다. 이 는 단지 데이터셋을 통해서 학습하는 현재 모델을 넘어설 수 있는 방법론이라고 밝히고 있다. 이번 이그나이트에서는 가상의 드론을 이용해 마이크로소프트 연구소에서 에어심(AirSim)이라는 초현 실적인 시뮬레이션 가상 공간에서 드론이 안전하게 나를 수 있게 학습할 수 있음을 보였다. 에어심은 애 저 인공지능과 엣지 서비스와 결합해 매우 복잡한 세계를 시뮬레이션할 수 있다.

디지털 책임

2016년에 마이크로소프트가 발표한 인공지능의 6개 원칙을 준수하기 위한 도구와 기술 역시 인공지 능 혁신을 통해서 이루어질 수 있다. 프라이버시에서는 호모모픽 암호와 차등 개인정보 보호 (Differential privacy) 기술을 활용하고, 투명성에서는 설명가능한 인공지능을 위한 해석가능한 인공지능 (Interpretable ML) 기술, 편향을 확인하고 이를 완화하기 위한 페어런(Fairlearn) 같은 기술은 디지털 책임을 위한 인공지능 기술의 혁신으로 구현할 수 있다는 점을 강조했다. 거짓 정보나 페이크 뉴스에 대한 대응은 하나의 회사가 할 수 있는 것이 아니기 때문에 연구자, 기관, 회사의 공동 협력이 필요하다는 점을 언급하면서 소개한 것이 프로젝트 오리진(Project Origin)이다. 마 이크로소프트 연구소는 여기에 기술적 접근을 제공하면서 퍼블리셔와 소비자 사이의 신뢰 체인을 제공해 진짜 뉴스와 정보를 확인할 수 있게 하고 있다. 미디어가 콘텐트를 발행하면 클라우드 서비스 안에 디지털 지문을 만들고, 퍼블리셔는 진품 인증을 받 으며 이를 분산 원장에 저장한다. 블록체인과 유사한 이 방식은 분산된 기관의 연합을 통해서 인증하며 고객은 자신이 보는 콘텐트에 대한 검증 결과를 확인할 수 있다.



<사진 출처 : freepik.com>


 

애저 퍼셉트(Percept)

이번에 프리뷰로 발표한 애저 퍼셉트는 애저 인공지능 기술을 엣지에서 간단히 구현할 수 있게 만드 는 하드웨어와 서비스 플랫폼이며, 기기 관리, 인공지능 모델 개발과 분석을 위한 클라우드 기능을 포함 한다. 이 플랫폼에는 애저 퍼셉트 비전이라는 지능형 카메라가 포함된 개발 키트를 제공하며, 애저 퍼셉트 스튜디오는 고객의 광범위한 코딩 경험의 유무와 상관없이, 인공지능 전체 생애주기를 통해 고객을 안내 한다. 다시 말해 개발, 학습, 개념 증명을 배포하는 것을 포함한다. 퍼셉트 비전과 퍼셉트 오디오는 개발 키트와는 별도로 판매하는데, 애저 클라우드 서비스와 연결되고 내장된 하드웨어로 가속하는 인공지능 모듈을 통해 엣지에서 음성과 비전 기능을 수행한다. 또한 제3의 반도체나 장비 업체와 협업을 통해 애저 퍼셉트 플랫폼에서 동작하는 지능형 엣지 기기의 생태계를 만 들고자 한다. 퍼셉트는 애저와 사물인터넷 기기 간의 양방향 커뮤니케이션을 위한 매니지드 서비스인 애저 IoT 허 브와도 연계하며, 퍼셉트 기반 솔루션은 머신 러닝 모델 모니터링, 검증, 거버넌스를 통해 개발과 배포에 서 협업을 하거나 속도를 올리고자 하는 MLOps와 통합할 것이다.




 

<출처 : 한국인터넷진흥원>

이 전 다 음
목록