中国现在古字可考的,仍以《说文》一书为大宗。此书所载,百分之九十几,系秦汉时通行的篆书。周以前文字极少。周以前的文字,多存于金石刻中(即昔人刻在金石上的文字),但其物不能全真,而后人的解释,亦不能保其没有错误。亡清光绪二十四五年间,河南安阳县北的小屯,发见龟甲、兽骨,其上有的刻有文字。据后人考证,其地即《史记·项羽本纪》所谓殷墟,认其字为殷代文字。现在收藏研究的人甚多。但自民国十七年中央研究院和河南省合作发掘以前所发现之品,伪造者极多(详见《安阳发掘报告书》第一期所载《民国十七年十月试掘安阳小屯报告书》,及《田野考古报告》第一期所载《安阳侯家庄出土之甲骨文字》。又吴县所出《国学论衡》某册所载章炳麟之言,及《制言杂志》第五十期章炳麟《答金祖同论甲骨文第二书》)。所以在中央研究院发掘所得者外,最好不必信据,以昭谨慎。
古人多造单字,后世则单音语渐变为复音,所增非复单音的字,而是复音的辞。大抵春秋战国之时,为增造新字最多的时代。《论语·卫灵公篇》:子曰:“吾犹及史之阙文也”,“今亡已夫”。这就是说:从前写字的人,遇见写不出的字,还空着去请教人,现在却没有了,都杜造一个字写进去。依我推想起来,孔子这种见解,实未免失之于旧。因为前此所用的文字少,写来写去,总是这几个字。自己不知道,自然可问之他人。现在所用的字多了,口中的语言,向来没有文字代表它的,亦要写在纸上。既向无此字,问之于人何益?自然不得不杜造了。(一)此等新造的字,既彼此各不相谋。(二)就旧字也有(甲)讹,(乙)变。一时文字,遂颇呈纷歧之观。《说文解字·序》说七国之世,“文字异形”,即由于此。然(子)其字虽异,其造字之法仍同;(丑)而旧有习熟的字,亦决不会有改变;大体还是统一的。所以《中庸》又说:“今天下”“书同文”。《史记·秦始皇本纪》:二十六年,“书同文字”。此即许《序》所说:“秦始皇帝初兼天下,丞相李斯乃奏同之,罢其不与秦文合者。”此项法令,并无效验。《汉书·艺文志》说:闾里书师,合《苍颉》《爰历》《博学》三篇,断六十四字以为一章,凡五十五章,并为《苍颉篇》。这似乎是把三书合而为一,大体上把重复之字除去。假定其全无复字,则秦时通行的字,共得三千三百。然此三书都是韵文,除尽复字,实际上怕不易办到,则尚不及此数。而《说文》成于后汉时,所载之字,共得九千九百十三。其中固有籀文及古文、奇字,然其数实不多,而音义相同之字,则不胜枚举。可见李斯所奏罢的字,实未曾罢,如此下去,文字势必日形纷歧。这是一个很严重的问题。幸得语言从单音变为复音,把这种祸患,自然救止了。用一个字代表一个音,实在是最为简易之法。因为复音辞可以日增,单音字则只有此数。识字是最难的事,过时即不能学的。单音无甚变迁,单字即无甚增加,亦无甚改变。读古书的,研究高深文学的,所通晓的辞类及文法,虽较常人为多,所识的单字,则根本无甚相异。认识了几千个字,就能读自古至今的书,也就能通并时的各种文学,即由于此。所以以一字代表一音,实在是中国文字的一个进化。至此,文字才真正成了语言的代表。这亦是文字进化到相当程度,然后实现的,最初并非如此。《说文》:犙,三岁牛。(左马右八),马八岁。犙从参声,(左马右八)从八声,笔之于书,则有牛马旁,出之于口,与“三八”何异?听的人焉知道是什么话?然则犙决非读作参,(左马右八)决非读作八;犙(左马右八)两字,决非代表参八两个音,而系代表“三岁牛,马八岁”两句话。两句话只要写两个字,似乎简便了,然以一字代表一音纯一之例破坏,总是弊余于利的。所以宁忍书写之烦,而把此等字淘汰去。这可见自然的进化,总是合理的。新造的氱、氮等字,若读一音,则人闻之而不能解,徒使语言与文字分离,若读两音,则把一字代表一音的条例破坏,得不偿失。这实在是退化的举动。所以私智穿凿,总是无益有损的。