语言文字数字化

125312230434233表示“我爱你”。23 144534’5 12343445125意为“I don’t know.” 这样的密码是不是很神奇呢?

语言文字数字化(language numerization)(LN for short)

一.LN概念

无限的句子由有限的词语组成,一层层往下切分可以得到语言的“原子”。例如,汉语有音节1281个(不带声调412个),音素29个(英语是44个)。这样我们可以用26个拉丁字母表现汉语。同理可证,其他语言也可以用26个拉丁字母表现。把26个字母再用易记、易切分的数字组合来表现,语言就被数字化了。语言数字化以后就成了运算、处理方便的密码了。我们用五个数字(1, 2, 3, 4, 5)的26个单向递增组合来表示26个字母(例如:13,35,235,只用1-5的数字组合且后面的数字必定大于前面的,所以1523得切分成15和23)。这样的组合用点阵表示就成了一种盲文;1, 2, 3, 4, 5分别与五指对应便可得到一种哑语。1, 2, 3, 4, 5可以再转化成二进制。把二进制转换为电信号便可以远距离传递信息了。如下所示:

语言文字–>拉丁字母–>(1-5组合)–>密码,盲文等

二.LN方案

1.字母表与1-5组合对应(ie.电传码)
A12 B145 C234 D14 E1 F134 G245
H35 I23 J124 K1234 L25 M345 N34
O45 P235 Q1235 R24 S13 T5
U123 V2345 W125 X1345 Y135 Z15

助记图(注意斜线的关系)
facilitating memorizing the LN

1-5的递增组合还有2, 3, 4, 1245, 12345这五个,我们让它们具有特殊意义,表示汉语时,”2″表示阳平”3″表示上声”4″对应去声(一声不标调)。

2.标点(沿用原语种标点)另:
1)角点”.”或空格 用于间隔单词(汉语中不用):How are you写成3545125.12241.13545123

2)上横(-) 表示横下为数值

3)下横(_) 表示横上为大写字母

1.标点主要在书写密码时辅助使用.

2. 组合难以切分时用数字”0″隔开,如:an写作12034不能写成1234(k);en写作1034不能写成134(f);ao写作12045不能写成1245(ü)(拼写汉语时使用);nt写作3405不能写成345(m)……

典型例句
I love you=23 252345 123(I lv u)
Come on,baby!=234453451 4534,14512145135!
Shallwego is a crazy boy!=13351225251251024545.2313.12.234241215135.14545135!

LN码的科学性:

1. 请你想一下带5的短语:五指、五环、五味、五行、五线谱……
2. 易记。才26个对应,比起蹩脚的密码本起来不知要简单多少倍!
3. 最常用的字母对应最短的数字串(英语中i, a, e, o, u五个元音和t, s两个辅音字母出现频率最高)
4. 最方便。能即时读出即时转换(这是传统密码难以望其项背的)
5. 转换方便。如前所述,可以派生出盲文哑语等。

LN码的应用:

我用它来“加密”日记中的关键词。另外我的网络各个账户的密码都是由字母、数字和特殊符号组成的,运用了LN和字母以及特殊字符的联系。您也可以有自己的用法。

更多内容请参看http://user.qzone.qq.com/23114190/blog/1258819864

加关注

Get every new post delivered to your Inbox.