这是一款倡导英文阅读的APP,包含两大模块,书籍阅读和新闻阅读,我们以人工智能中自然语言处理的各项技术应用为我们的核心壁垒,包括大量文字的预处理、书本和新闻的推荐、即时翻译、文字转语音的有声阅读、难度自动分级、阅读后自动出题等。
对于图书,我们包含5万本英文原著,均为从Gutenberg计划获取的质量上乘的书籍,经过文字的预处理去除多余的页码信息、冗余文字等,再自动分割章节,导入到我们远程的数据库中。
对于新闻,我们每天从10+个英文新闻网站爬取约1000条新闻,这些网站包含CNN、BBC、USA today等知名新闻网站,也包含China Daily, The Guardian之类和中国相关性大的网站
我们以章节和新闻为单位,预处理了其中的句子和单词,做到可以在阅读中实时划词翻译、整句翻译、特有名词专属解析等,降低了用户的阅读难度,更做到了实时文字转语音,方便用户通勤路上“听书”、“听新闻”
核心技术为多项自然语言处理技术的应用,包括Automatic Segmentation,Recommedation System,Machine Translation,Text To Speech,Question Generation等,其中Question Generation目前是state-of-the-art的水准,其余均为现有最佳方法的实际运用和改善,有较高技术壁垒。
现在市场上的英文学习软件大多为单词学习,类似书籍阅读也以书虫系列改编书籍为主,很少有英文原著阅读的软件,功能也都比较弱,大部分只有划词翻译的功能,缺少更多辅助阅读的方法。英文新闻阅读和书籍阅读结合可以更高效地留存用户,新闻主打休闲、短时间阅读,书籍主打长时间阅读,两者结合可以满足大部分英文阅读的需求。
公司为上海交通大学创业团队,获得朱教授大力支持,朱钻研自然语言处理方向,和本项目结合紧密,重合度高,任何该领域的创新方法可以很迅速的实现在“爱问读书人”APP中