메사리: 미라 네트워크, AI 신뢰성 대폭 향상

뉴스알리미 · 25/05/22 14:28:52 · mu/뉴스

AI의 신뢰성 문제를 구조적으로 해결할 수 있을까. 메사리가 최근 발간한 심층 리포트에서 AI 출력 검증 프로토콜 ‘미라 네트워크’를 집중 조명하며, “AI가 생성하는 정보의 진위를 검증하기 위한 핵심 인프라로 부상하고 있다”고 평가했다.

리포트에 따르면, 미라는 공식 발표를 통해 “현재 하루 30억 개 이상 토큰을 검증하며, 450만명 이상의 사용자 기반을 갖춘 파트너 앱에 통합돼 운영되고 있다”고 밝혔다. 토큰은 AI가 생성한 텍스트를 구성하는 최소 단위로, 단어·어미·구두점 등으로 구성된다. 이 수치는 하루 수백만 개 문장에 해당하는 콘텐츠를 모델 간 합의를 통해 검증하고 있다는 의미다.

미라는 AI 출력물을 신뢰도 측면에서 검증하는 탈중앙 프로토콜이다. 단일 AI 모델의 자체 판단이나 인간 리뷰에 의존하지 않고, 각기 다른 AI 모델들이 네트워크를 구성해 출력 내 사실 주장을 독립적으로 평가하는 방식이다. 이를 통해 △사실 정확도는 70%에서 96%로 향상됐고, △환각은 약 90%까지 감소했다는 것이 메사리의 분석이다.

미라의 핵심 메커니즘은 ‘팩트 분해와 합의’다. AI가 출력한 응답은 문장 단위로 분해돼 개별 사실 주장으로 변환된다. 예컨대 하나의 답변에는 “2023년 미국 GDP는 25조달러였다”와 같은 주장이 포함될 수 있다. 이 주장들은 미라 네트워크 내 다양한 검증자 노드로 전달된다.

각 노드는 서로 다른 구조의 AI 모델을 실행하며, △참 △거짓 △불확실 중 하나로 해당 주장을 평가한다. 미라는 일정 수준 이상의 다수결 기준을 충족할 경우 해당 출력을 통과시키며, 기준에 미달하면 출력물은 거부되거나 경고와 함께 반환된다. 모든 과정은 온체인으로 기록되며, 어떤 주장에 어떤 모델이 참여했는지, 어떤 판단을 했는지 모두 검토할 수 있다.

메사리는 이를 “단일 모델의 확신에 의존하지 않는 새로운 형태의 AI 신뢰 구조”라고 평가했다. “모델 간 다양성이 클수록 동일한 환각을 반복할 확률은 낮아진다”며, “이 점을 활용해 미라는 집단적 사실성 검증을 수행한다”고 설명했다.

리포트는 기존 AI 신뢰성 확보 방식의 한계를 조목조목 짚는다. △사람이 직접 검토하는 HITL은 느리고 비용이 많이 들며, 편향의 위험도 있다. △룰 기반 필터는 고정된 규칙만 감지할 수 있어 창의적 오류나 새로운 문맥에 대응하기 어렵다. △자체 검증 모델은 대부분의 경우 잘못된 정보에 스스로 높은 확신을 가지는 문제를 해결하지 못한다. △앙상블 모델은 동일한 벤더 또는 데이터 기반의 유사 모델이 많아, 다각도의 검증이 어렵다.

메사리는 “미라는 기존 방식이 겪는 확장성, 정확성, 투명성 문제를 모두 해소할 수 있는 구조”라며 “분산 검증 구조와 합의 기반 설계로 시스템적 신뢰를 형성한다”고 밝혔다.

미라 네트워크는 AI 검증을 위한 컴퓨팅 자원을 확장하기 위해 ‘노드 위임자’ 모델을 운영하고 있다. 노드 위임자는 직접 노드를 운영하지 않고, GPU 자원만 제공한다. 실제 검증은 파트너 노드 운영자가 수행하며, 위임자는 해당 노드의 검증량과 성능에 따라 보상을 받는다.

주요 파트너로는 △아이오넷 △에이셔 △하이퍼볼릭 △엑사비츠 △스피론 등이 있다. 이들 파트너는 미라 네트워크의 검증 노드를 운영하며, 대규모 검증 처리를 지원한다. 참여자는 1인당 1개의 라이선스만 보유할 수 있으며, KYC와 영상 인증 절차를 통해 신원 확인이 이뤄진다.

메사리는 “탈중앙 GPU 인프라 생태계가 미라의 핵심 확장 동력”이라며 “중앙 집중 인프라 투자 없이 대규모 검증 처리량을 유지할 수 있다”고 분석했다.

리포트에 따르면, 미라 네트워크를 통과한 AI 출력은 기존보다 최대 26% 높은 정확도를 보인다. 특히 교육·금융 분야에서는 기존 70% 수준이던 정확도가 96%까지 상승했으며, 환각성 오류는 90% 이상 줄었다. 이러한 변화는 모델을 재학습시키지 않고, 오직 검증 시스템만으로 이뤄졌다는 점에서 주목할 만하다.

미라 생태계는 챗봇, 교육 플랫폼, 핀테크 애플리케이션 등 다양한 분야에 이미 통합되어 있다. 대표적 적용 예는 △Verified Generate API를 활용한 내부 콘텐츠 검증 시스템 △챗 인터페이스에서 사용자 모르게 작동하는 백엔드 검증 계층 등이다.

메사리는 “미라는 AI 출력의 신뢰성을 실시간으로 보장하는 유일한 시스템 중 하나”라며 “단일 모델이나 중앙 통제를 벗어난 구조에서 진위를 판단할 수 있다는 점에서 획기적”이라고 평가했다. 또 “향후 제3자 감사가 병행될 경우, 미라가 규제 환경이나 대량 처리 시스템에서 활용될 가능성이 높다”고 덧붙였다.

118
0

Comments 0

Loading...