- BIGVOCA의 탄생나에게는 그 마법의 영어 8000단어가 너무나도 절실히 필요했다. 그래서 조사를 시작했다. 역시 '구글신'은 모든 것을 알고 있었다. 검색을 해보니 온라인상에서 영어 단어 뭉치들을 찾는 것은 그렇게 어려운 일이 아니었다. 그중에서도 가장 큰 뭉치는 모든 책을 전자화하는 구텐베르크 프로젝트에서 추출된 단어 뭉치였다. 2만 4천 권의 책에서 추려진 단어의 모수는 약 8억 개였다. 구텐베르크 프로젝트의 책들은 저작권이 만료된 고전이 많아서 단어 뭉치 안에는 고어가 많았다. 그래서 단점을 보강하기 위해 TV 대본과 다양한 자료에서 만들어진 단어 뭉치들과 합쳐서 단어 모집단을 11억개로 늘렸다.(p.05)