AI 분석 프레임워크 소개

*현재 페이지는 BETA 서비스입니다.

본 자료 복제에는 저작권 소유자의 동의가 필요합니다.
본 자료의 내용은 한국지능정보사회진흥원(NIA)의 공식 견해와 다를 수 있습니다.

요약

첨단 정보기술의 비약적인 발전은 공공부문 전반에 걸쳐 정보시스템 구축과 디지털 서비스 활용의 복합성을 심화시키며 공공서비스 구현 유형을 더욱 다양하고 복잡하게 만들고 있다 특히 기계학습 알고리즘과 GPU 인프라의 발전으로 초거대 생성형 AI 모델 및 특정 도메인에 최적화된 소규모 AI 모델의 수요도 지속해서 높아지고 있으며, 서비스 제공을 위한 AI 모델 및 인프라 구성의 다양성과 복잡성이 증가하고 있다.

이러한 기술 환경의 복잡성은 공공부문이 최신 기술과 서비스를 효과적으로 활용하여 공공서비스를 제공하는 데 상당한 어려움을 초래하고 있다. 특히 다양한 AI 모델과 알고리즘에 대한 체계적인 분석 정보가 부족하여, AI 기술을 성공적으로 도입하고 활용하는 데 제약이 있다. 공공부문 수요자들은 첨단 AI 기술의 활용을 요구하지만, AI 기술의 빠른 변화 속도를 자체적으로 추적, 관리, 분석하며 활용하는 것은 쉽지 않다.

기하급수적으로 쏟아지는 AI 기술을 분석하고 효과적으로 활용하기 위해서는 정확하고 체계적인 지식 기반이 필요하며, 이러한 지식 기반은 기술의 급격한 발전에 맞춰 지속적으로 업데이트하고 관리되어야 한다. 본 가이드라인은 공공부문에서 지능형 정보시스템을 구축하거나 첨단 서비스를 활용할 때 필요한 기술 분석 및 선정 과정을 체계적으로 지원하는 분석 프레임워크를 제시하는 것을 목표로 한다.

공공부문은 '지능기술 및 인프라 분석 프레임워크'를 활용하여 지능 기술을 체계적으로 평가하고 도메인에 적합한 기술을 신속하고 효율적으로 공공서비스에 적용할 수 있다. 즉, 정보화 사업 추진 시 본 프레임워크를 활용 함으로써 설계, 구현, 테스트, 배포, 운영에 이르는 모든 단계에서 지능 기술 및 인프라를 객관적으로 비교, 평가하여 도메인에 최적화된 서비스를 효과적으로 제공할 수 있다.

I. 추진 배경

첨단 정보기술의 비약적 발전과 변화가 공공서비스에 적용되면서 이를, 구현 방식이 점차 복잡화되고 다양화되었으며. 기술적·관리적 측면의 복잡성도 함께 증가하고 있다. 이러한 변화는 공공부문 전반의 정보시스템 구축과 디지털 서비스 활용 방식에 중대한 영향을 미치고 있다.

인공지능(AI) 기술의 급격한 발전은 AI 모델과 알고리즘의 다양성과 복잡성을 심화시키고 있으며, 대규모 AI 모델뿐 아니라 특정 도메인에 최적화된 소규모 AI 모델의 수요도 증가하고 있다. 이러한 AI 모델들은 자연어 처리, 이미지 생성, 컴퓨터 비전 등 다양한 분야에서 활용되고 있다.

대표적인 사례로, 'Hugging Face'에서는 2022년에는 신규 AI 모델 등록이 비교적 느리게 증가했으나, 2023년 이후로 기하급수적으로 증가하여 2024년 11월 기준으로 약 114만 개의 AI 모델을 제공하고 있다. 이는 AI 기술의 발전 속도가 가히 폭발적임을 보여준다.

Hugging Face LLM 모델의 누적 다운로드 성장

이러한 AI 모델들은 크기(예: 7B, 13B, 80B, 175B, 204B 등), 공개 여부(코드, 가중치, 데이터의 오픈 상태), 기능적 분류(언어, 이미지, 음성 등), 서비스 수준 등 다양한 기준에 따라 구분된다. 이처럼 모델 간의 특성과 분류 방식이 다양해짐에 따라, 전체적인 기술 환경의 복잡성도 점점 증가하고 있다. 아래는 2024년 8월 말부터 한달동안 Hugging Face에서 다운로드된 주요 AI 모델의 유형과 사용량을 보여주는 그래프로, 다양한 모델이 실제로 광범위하게 활용되고 있음을 알 수 있다.

Hugging Face에서 사용된 AI 모델의 주요 유형 및 다운로드 건수

또한 AI 기술을 더욱 효율적으로 응용할 수 있는 도구와 라이브러리의 수요가 증가하고 있으며, AI 모델을 구축하고 운영하는 데 필요한 데이터 처리 도구, GPU 및 고성능 컴퓨팅 인프라, 관련 기술 및 서비스의 활용 구조가 더욱 복잡해지고 있다.

공공부문에서는 첨단 기술들을 도입하여 공공서비스를 개선하고자 하는 강력한 필요성이 있지만, 첨단 정보기술의 비약적인 발전으로 공공부문 전반에 걸쳐 정보시스템 구축과 디지털 서비스 활용의 복합성이 심화되었기 때문에 지능 기술과 인프라를 효율적으로 구성·활용하고 관리하는 데 상당한 난제를 겪고 있다.

공공부문 정보화 담당자들은 확장성, 비용 효율성, 접근성, 업데이트 및 유지보수 등 다양한 기준을 고려하며 클라우드 기반의 AI 서비스 환경구성과 구축형 AI 서비스 환경구성을 검토하고, 구성 방향 따라 세부적인 기술을 분석·도입해야 하는 상황에 직면해 있다. 하지만 다양한 AI 모델, 알고리즘, 데이터 도구, 인프라 등에 대한 체계적인 분석 정보, 즉 기술 프로파일링이 부족하여 성공적인 기술 도입과 활용이 쉽지 않은 상황이다. 급변하는 지능 기술을 효과적으로 추적하고 관리하며 이를 적절히 활용하기 위해서는 지능 기술에 대한 지속적인 프로파일링 데이터 갱신이 필수적이나, 이러한 작업을 개별 기관에서 자체적으로 수행하기에는 인프라와 자원이 충분하지 않은 것이 현실이다.

공공부문에서의 이러한 문제점은 지능 기술의 체계적이고 종합적인 분석 및 평가를 가능하게 하는 지식 기반의 필요성을 제기한다. 단순히 지능 기술을 도입하는 것에 그치지 않고, 기술의 첨단성, 안전성을 분석하여 각 도메인에 적합한 기술을 도입하고 확장성 있는 인프라 환경을 구성하는 것이 중요하다.

이와 같은 분석을 체계적으로 수행하기 위해서는 지능 기술의 기능, 성능, 품질 등을 철저히 평가하고, 이를 바탕으로 최적의 기술을 선정할 수 있는 체계적인 분석 프레임워크가 필수적이다. 특히, 기술 발전이 급속하게 이루어지는 현 상황에서는 지식 기반을 정기적으로 갱신하고, 기술의 발전에 맞추어 지식을 체계적으로 관리하는 과정이 필요하다. 지능 기술을 도입하기 위해 최신 트렌드를 끊임없이 모니터링·분석하여, 적시에 기술을 활용할 수 있는 체계가 마련되어야 한다.