Open토토사이트 공지의 음성 복제 토토사이트 공지 모델, 15초 샘플만 있으면 가능

음성 제너레이션, 2022년 말부터 개발 중이며 챗GPT의 소리내어 읽기 기능을 지원

  • 기사입력 2024.04.02 12:21
  • 최종수정 2024.07.01 14:35
  • 기자명 배운철

OpenAI는 15초 분량의 음성 클립을 기반으로 합성 음성을 생성할 수 있는 자체 개발한 텍스트-음성(text-to-voice) 생성 플랫폼 음성엔진(Voice Engine)에 대한 제한적인 이용을 제공한다. Ai가 생성한 음성은 화자와 동일한 언어나 다른 여러 언어로 명령에 따라 텍스트 프롬프트를 읽어줄 수 있다.

음성엔진 이용 권한을 가진 회사는 교육기술 회사인 에이지 오브 러닝(Age of Learning), 비주얼 스토리텔링 플랫폼 헤이젠(HeyGen), 의료 소프트웨어 제작사인 디마지(Dimagi), Ai 커뮤니케이션 앱 제작사인 리복스(Livox), 의료 시스템인 라이프스팬(Lifespan) 등이 있다.

오픈토토사이트 공지 음성엔진

OpenAI가 공개한 사례에서는 에이지 오브 러닝이 사전 스크립트(pre-scripted) 음성 콘텐츠를 생성하고 GPT4로 작성한 학생의 '실시간 개인화 답변'을 읽어주는 기술을 어떻게 활용했는지 들어볼 수 있다.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ

OpenAI는 2022년 말부터 음성엔진 개발을 시작했다. 이 기술은 텍스트 음성 변환 API와 챗GPT의 소리내어 읽기 기능을 위한 사전 설정(preset) 음성을 지원한다고 밝혔다. OpenAI의 음성엔진 팀원인 제프 해리스(Jeff Harris)는 테크크런치와의 인터뷰에서 음성엔진이 "라이선스가 있는 데이터와 공개적으로 사용 가능한 데이터를 혼합하여" 훈련되었다고 말했다. OpenAI는 음성엔진이 우선 약 10명의 개발자에게만 제공될 것이라고 밝혔다.

텍스트-오디오 생성토토사이트 공지 기술의 발전

Ai 텍스트-오디오(text-to-audio) 생성은 계속 발전하고 있는 생성Ai의 한 분야다. 그동안 대부분 악기 소리나 자연음 생성에 초점을 맞추고 있지만 음성 생성에 초점을 맞추는 곳은 많지 않았다. 음성 생성 분야는 2023년 버지캐스트(Vergecast)가 살펴본 Ai 음성 복제(voice cloning) 기술과 도구를 제공하는 팟캐슬(Potcastle)과 일레븐랩스(ElevenLabs) 같은 회사가 있다.

회원전용기사

로그인 또는 회원가입을 해주세요. (회원만 열람가능, 회원 가입 무료)

인생한방 토토사이트 - 트렌드와칭 청소년 토토사이트 추천가입 - 트렌드와칭
"카카오톡 오픈채팅에 참여하시면 최신 소식과 자료를 받아보실 수 있습니다. (참여하기)"

brian@trendw.kr

sky 토토사이트 < 안내데스크 - 트렌드와칭 보도자료 정수근 토토사이트 < 안내데스크 - 트렌드와칭

이 기사를 공유합니다
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전