똑똑한 AI 더 똑똑하게 만드는 ‘셀렉트스타’, 40억원 규모 신규 투자유치

데이터 수집·가공·분석·제공하는 셀렉트스타, 신규투자 유치로 코스닥 상장 가시화 AI 시대 본격 개막, 더 똑똑한 AI 위한 데이터 라벨링 수요 급증 “빠른 시일 내에 유니콘 될 것”, 셀렉트스타의 성장 잠재력↑

160X600_GIAI_AIDSNote
사진=셀렉트스타

7일 인공지능(AI) 학습 데이터 플랫폼을 운영하는 ‘셀렉트스타’가 산업은행으로부터 40억원 규모의 시리즈 A 신규 투자를 유치했다고 전했다. 셀렉트스타는 지난 2019년 카카오벤처스로부터 시드투자 4억원, 2020년 카카오벤처스, 코오롱인베스트먼트로부터 시리즈 A 40억원, 2022년 카카오벤처스, 컴퍼니케이파트너스로부터 시리즈 A Extension 90억원의 투자를 받은 바 있다. 이로써 셀렉트스타의 누적 투자금은 총 174억원으로 집계됐다.

시리즈 A 신규 투자 받은 셀렉트스타, IPO에 박차 가할 것

셀렉트스타는 2018년 11월 카이스트 창업팀에서 시작된 스타트업으로 AI에 필요한 학습 데이터를 수집·가공해 제공하는 플랫폼 기업이다. SQL 명령어로 ‘모든 데이터를 호출한다’는 뜻을 갖는 셀렉트스타는 현재 크라우드소싱을 통해 데이터를 수집 및 라벨링하는 플랫폼 ‘캐시미션’과 데이터 분포 분석 및 데이터 큐레이션 ‘다투모’를 운영하고 있다.

현재 삼성, LG, SK, 네이버 등 230여 개의 기업이 셀렉트스타를 통해 AI 학습데이터를 구축하고 있다. 셀렉트스타 측에 따르면 총 누적 작업 데이터 수는 1억3,000만 건에 달하며 ▲오픈 소스 모델을 기반으로 한 반자동 데이터 가공 ▲생성 AI를 활용한 데이터 합성 ▲자체 개발 데이터셋 분석 솔루션 등 기술을 통한 데이터 품질과 가격 경쟁력이 강점이다.

셀렉트스타는 이번 투자를 통해 코스닥 상장에도 박차를 가할 것으로 보인다. 지난 6월 대신증권을 상장 주관사로 선정하고 IPO(기업공개) 로드맵을 수립한 셀렉트스타는 기술 평가를 통한 특례 상장으로 오는 2025년까지 상장 절차를 마무리할 전망이다. 김세엽 셀렉트스타 대표는 “산업 현장에서 AI가 점점 복잡하고 중요한 작업을 수행하게 되면서 맞춤형 데이터로 AI 모델을 직접 미세조정(파인튜닝) 하는 작업의 중요성 또한 부상하고 있다”며 “이번 투자를 통해 올 인 원(All In One) 데이터 플랫폼으로 도약하고, IPO에 성공할 것”이라고 전했다.

쉽고 빠르게 AI 기능 향상하는 셀렉트스타 시스템

현재 AI 업계에서 가장 큰 패러다임 변화를 일으키고 있는 ‘데이터 센트릭 AI(데이터 중심 인공지능)’은 AI를 더 똑똑하게 만들어 주는 시스템이다. 김 대표는 이에 대해 “AI가 예측불허한 상황 변화에 대처할 수 있도록 오류를 데이터화해 바로잡아 주는 시스템”이라고 설명했다. 또 셀렉트스타의 서비스는 기획→큐레이션→데이터셋 구축 →AI 학습→분석 단계를 순환하며, 비교적 적은 비용과 시간으로 AI 성능을 향상할 수 있다고 강조했다.

실제로 시장 출시를 앞둔 다투모 피처 스페이스 툴은 데이터셋 커버리지와 엣지 케이스(알고리즘이 처리하는 데이터 값이 알고리즘의 특성에 다른 일정한 범위를 넘을 경우 발생하는 문제)를 분석하고 선별하는 기능을 갖고 있다. 회사 측에 따르면 국내에서 처음 선보인 데이터셋 분석 소프트웨어로, 원천 데이터를 다차원 벡터로 변환해 차원 축소 기법으로 정밀한 2차원 분포 그래프를 제공해 데이터셋 분석이 용이해진다는 장점이 있다. 업계 관계자들 역시 다투모를 통해 데이터셋 커버리지를 직관적으로 확인할 수 있는 점, 기존 AI 연구자들이 수행하던 데이터 처리와 분석의 반복 노동을 자동화한 점, 대용량 데이터셋 처리 기술과 데이터셋 특징을 추출하는 기술을 적용한 점을 들며 호평을 쏟아냈다.

김세엽 셀렉트스타 대표가 2022년 12월 8일 개최된 ‘AI 서밋 서울 2022’ 행사에서 피쳐스페이스 기반 데이터셋 분석 도구 ‘다투모 FST’ 솔루션에 대해 설명하고 있다/사진=셀렉트스타

AI 업계서 주목받는 데이터 라벨링

한편 챗GPT, 자율주행차량 등을 필두로 AI 시대가 본격적으로 개막하면서 데이터 라벨링(수집·가공 서비스) 수요도 전 세계적으로 급증하고 있다. 세계 4대 AI 석학으로 꼽히는 앤드류 응(Andrew Ng) 스탠포드 교수는 ‘데이터의 품질이 AI 모델의 성능에 가장 큰 영향을 미친다’는 연구 결과를 발표해 양질의 AI 데이터 구축 필요성을 부각한 바 있다. 아울러 글로벌 리서치 기관 그랜드 뷰 리서치(Grand View Research) 역시 2020년 약 8조원이었던 글로벌 AI 데이터 시장이 연평균 24%의 성장하며 오는 2028년에는 46조원에 달할 것이란 전망도 내놨다. 전 세계적으로 셀렉트스타와 같은 데이터 수집·가공 분야의 기업들이 높은 가치를 인정받는 이유다.

기업가치 1조원이 넘는 유니콘 기업도 등장했다. 미국 데이터 수집·가공 기업 피겨 에잇(Figure Eight)은 2019년 3월 호주의 언어 번역 플랫폼 기업인 애픈(Appen)에 약 3억 달러(약 3,957억원)에 인수됐다. 같은 해 8월에는 미국 실리콘밸리 데이터 라벨링 스타트업인 ‘스케일AI(Scale AI)’도 시리즈 C 투자에서 1억 달러(약 1,319억원)의 기업 가치를 인정받으며 유니콘으로 등극했다.

최근 셀렉트스타는 뉴립스(NeurIPS), EMNLP, CVPR 같은 글로벌 톱 AI 학회에 지속적으로 데이터셋을 공개하는 등 데이터셋 품질에 대한 공신력을 인정받으며, 성장 잠재력을 드러내고 있다. 지난 2020년 시리즈 A 투자사로 참여한 김보영 코오롱인베스트먼트 팀장은 “AI 시대의 기반이 되는 데이터 라벨링 분야에서 셀렉트스타는 독보적인 기술 경쟁력을 보유했다”며 “글로벌 시장 진출 가능성이나 관련 산업으로의 확장성이 상당히 높을 것으로 보인다”고 평가했다. 지난해 시리즈 A 익스텐션 투자사로 참여한 도재원 컴퍼니케이파트너스 수석팀장도 “다양한 매출처를 기반으로 빠른 성장을 이룬 셀렉트스타의 데이터 플랫폼이 높은 가능성을 갖고 있는 것으로 판단했다”며 셀렉트스타의 사업성을 인정했다.

자율주행, 시니어케어, 디지털 플랫폼 전환 등 글로벌 시장에서 AI의 필요성이 날로 증가하고 있다. 김 대표는 “미국 경쟁사인 스케일AI는 유동성이 좋았던 2021년에 기업 가치를 8조원 정도 인정받았다”며 “이른 시일 내에 세계 무대를 휘어잡는 유니콘이 되도록 노력하겠다”고 포부를 전했다.