이 질문은 텍스트앳 개발팀이 개발을 하면서 수없이 들었던 질문이에요. 심지어 개발을 하는 저희도 개발 도중에 이 의문을 계속 가지고 있었죠. 저희 개발팀도 이 질문에 대한 확신없이 오로지 신념으로 개발에만 집중했었답니다.
하지만, 수많은 패턴 추출과 테스트의 결과, 가능하다는 결론에 다다랐고, 실제로 만들어진 감정분석모델은 외부 데이터를 이용한 블라인드 테스트에서 아주 우수한 예측력을 선보였습니다.
물론, 수많은 데이터와 고차원적인 통계적 분석 방법, 텍스트 추출 방법 등도 도움을 주었지만, 이게 가능했던 더 근본적인 이유가 있습니다. 그것은 바로 ‘좋아하는 사람에게 보내는 문자와 좋아하지 않는 사람에게 보내는 문자가 똑같을 수 없다’는 아주 평범하고, 어찌보면 당연한 진리이지요.
어떤 사람이든 간에, 같은 말을 하더라도 자신이 정말로 관심있는 사람과 전혀 관심없는 사람에게 보내는 문자가 같을 수는 없습니다. 스스로 그걸 숨기려고 해도, 심지어 자신이 인지하기도 전에, 내용에서, 형식에서, 뉘앙스에서 다양하고 미묘한 차이들이 드러나게 되죠. 그건 사람이라면 너무나도 당연한 반응입니다. 바로 그 ‘미묘한 차이’들이 무엇이고, 그것이 어떤 방식으로 드러나는지를 파악하고 읽어내는 것이 바로 텍스트앳입니다.
Posted in: 텍스트앳의 작동원리