이 글은 How to Design for Voice: 5 Tips to Get Started를 번역,참고한 글입니다.
최근 인공지능 스피커들이 대거 나오면서 음성에 대한 UI 디자인이 대두되고 있다.
시장조사 업체 가트너에 따르면 AI 스피커 시장은 2021년 35억 2000만 달러 규모로 커진다고 한다.
이 말은 음성 기반 경험이 일상화 된다는 이야기이며 이제 UX디자이너들은 그래픽 UI 뿐만 아니라 보이스 UI도 디자인 해야한다는 것이다.
물론 보이스 UI디자인은 기존의 UX디자인 프로세스와 많은 비슷한 점들이 있다. 유저 리서치, 퍼소나 제작, 포로토타이핑, 사용성 테스트 등은 보이스 UI 설계에도 중요한 요소가 될 것이다.
그러나 몇 가지 크게 다른 점들이 있으니 살펴보도록 하자.
1.만들어놓은 유저 플로우를 던져버리고 다시 시작해라.
기존의 GUI 체계와는 달리 유저는 다른 목표들을 이루기 위해 보이스 UI를 사용할 것이다.
예를 들어 뮤직 스트리밍 서비스를 사용한다고 가정해보자. 여러분은 유저가 보이스 UI를 사용해 플레이리스트를 트는 것을 하고 싶다고 생각할지도 모른다.
그런데 리서치를 하다보니 유저가 실제로 보이스로 음악을 통제하는 경우는 여러분의 생각과 아예 다를 수도 있다. 그들은 즉각적으로 노래 제목만 말하고 플레이리스트가 아닌 노래를 바로 듣고싶어할수도 있다.
이것이 보이스 UI시대에 유저가 어떤 목표를 이루고싶어하는지 여러분이 깊이 고민해봐야할 이유이다.
2.Use Case를 이해할 수 있게 만들어라.
기업들은 이제 보이스 UI 시대에 사로잡힐 것이다. 여러분의 상사가 “기존의 기능들 다 보이스 UI버전으로 리디자인해와” 라고 말할수도 있다.
그러나 보이스 UI는 회사가 중심이 되어선 안된다. 반드시 유저 중심이 되어야 한다. 그래서 유저 리서치는 중요하다. UX디자이너들은 어떤 상황에서 사람들이 보이스 UI를 사용해서 편안함과 만족감을 얻는지 알아야 한다. 예컨대, 보이스 UI 사용시 , 자동차에서는 어떻게 편안함을 얻고 기차에서는 왜 불편한지를 알아내야 한다. 음성으로 식료품을 주문할 수는 있다. 하지만 옷을 주문하는 것은 시각적인 검증 절차 상 부적합할 수 있다. 이런 차이를 알아내야 한다.
우리가 보이스 UI에 익숙해질수록 우리는 이 UI를 사용하여 더 많은 목표를 이루는 상황을 쉽게 찾을 것이다. 예를 들어 요리 시, 여러분의 손이 더러워 무언가 만질 수 없을 때, 보이스로 레시피를 전달받을 수 있다면 여러분의 요리에 대한 UX는 큰 향상을 겪을 것이다.
3.대화를 넘어선 소통 / 시스템 상태를 보여줘라.
여러분이 노트북이나 스마트폰으로 GUI를 사용할 때, 여러분은 여러분이 하고 있는 것을 보게 된다. (WYSIWIG = What you see is what you get = 내가 하고있는 것을 바로 볼 수 있는 것)
허나 보이스 UI를 사용한다면 여러분은 시스템 상태를 알 수 있는 시각적인 단서를 가질 수 없다. 만약 내 보이스 기기가 부서진다면 내가 어떻게 알 수 있겠는가?
이미 새로운 방식이 있긴하다. 아마존의 음성인식 스피커는 상태를 나타내기 위해 미묘한 플래시 라이트를 비춘다거나 비-파괴적인 소음을 사용한다.
4.유니크 셀링 포인트를 나타내는 개성을 만들어라.
이 주제는 보이스 UI에 대해 흥미로운 파트 중 하나이다.
이전에는 디자이너가 글의 분위기, 컬러 스키마나 이미지 가이드라인 등을 통해 제품을 결정지어 왔다.
이제 디자이너들은 전체적인 개성을 창조해내야 한다. 시스템 퍼소나를 만드는 것은 최고의 보이스 UI를 만드는데 기여할 것이다.
5.Command들은 끔찍한 UX를 방지하기 위해 확실하게 동작해야 한다.
이전에 나온 음성 인식 제품들은 다른 악센트나 유저의 예기치 못한 커맨드들을 이해하지 못하는 시스템 때문에 실패했다. 유저는 종종 그때의 음성 인식 기술 때문에 좌절하곤 했다.
현재의 클라우드 컴퓨팅, 인공지능, 머신 러닝은 시스템 뒤에 있는 보이스 UI를 더욱 똑똑하게 만들고 있다. 그들은 순간적으로 엄청난 양의 데이터에 접근해 유저 커맨드의 많은 변화들을 이해하고 그에 따라 응답할 수 있다.
이제 아무 준비없이 음성 인식 소프트웨어 개발에 착수한 팀도 데이터 과학자를 가지게 될 것이며 다량의 커맨드도 인식할 수 있게 통계 모델링을 적용할 것이다.
여러분이 만약 현재 있는 음성 서비스를 디자인 한다면 예컨대, Amazon Alexa skill을 만든다면, 여러분은 다른 종류의 커맨드들을 만들고 있는 여러분 자신을 발견하게 될지도 모른다.
Order me a pizza, send me a pizza, deliver me a pizza, bring me a pizza, get me a pizza 등등에 대한 커맨드들을 말이다.
다음 10년 사이에 음성이 어덯게 HCI(Human-Computer-Interaction: 인간과 컴퓨터의 상호작용 분야)분야를 이끌어 나갈지가 주목된다.
머신 러닝은 기하급수적인 향상을 만들어내고 있다. 이제는 만약 곧 기계들이 drunken answer machine 메시지를 인간보다 더 잘 이해한다고 해도 전혀 놀랍지 않을 것이다.
여러분이 음성에 관심이 있다면 지금은 참여하기 엄청 좋은 시대이다.
음성인식 과학자, 프로그래머, UX디자이너까지 이 거대한 움직임을 리드할 사람들에 대한 막대한 수요가 있을 것이기 때문이다.