1. 字种数就是一篇文章中所有不重复的字的数量。
比如说,“我的,你的”这句话里,虽然“的”字出现了两次,但因为它重复了,所以字种数只算1个“的”,加上“我”和“你”,总共字种数就是3。
2. 字种数的统计基于语素,语素是最小的有意义的语言单位。
想象一下,语素就像是搭积木的小块儿,每个小块儿都有自己的意思,不能拆成更小的、还有意义的部分了。就像“苹果”这个词,不能拆成“苹”和“果”后,“苹”还单独有意义,所以“苹”和“果”各自都是一个语素,但在这个词里统计字种数时,我们只算1个“苹”和1个“果”。