• 退休园地

胡运发:道大天大地大人也大

2015.03.20

--胡运发教授访谈录

采访时间:2014 年 11 月 28 日 下午

地    点:逸夫楼 5 楼

主提问兼录音:徐文奇(2011 级软件工程专业学生)

参加访谈:       郭之春(2014 级保密管理专业学生)、李梦棋(2014 级保密管理专业学生)、姜峻岩(2014 级计算机专业学生)

 

学生:非常感谢胡教授在百忙之中接受我们的采访。胡教授在教学与科研两个方面的建树都令人瞩目,在个人工作经历方面也比较丰富,听说你是从国防科技大学调来复旦的,请您先给我们谈谈你的工作经历好吗?

胡教授:我是 1964 年毕业后留校,1968 年文革期间,受学校安排我参加上海一个攻关科研项目到 1977 年。1978 年调到国防科技大学的,校址在长沙。国防科技大学有着研发先进计算机系统的优良传统,代表了我国的最高水准,从银河一号、银河二号、银河三号等直到天河二号,现在的天河二号机器已是亿亿次了,性能超过了美国。当时的银河机还没有超过,是模仿美国的一个机型,大概是 1973 年左右的机型。到了 1983 年才完成,我们跟它相差十年左右,现在我们超过美国了,但是工程的基础工作是从 1978 开始的。

 

学生:那是项目做完后就回复旦这边了吗?

胡教授:我是 1990 年回到复旦的,为什么要回来呢?当时我在国防科技大学还是可以的。进国防科技大学的时候,就给自己立了三条:

第一,要教书,是老师,不教书当老师肯定不行。至少要上一门课。

第二,要写论文,如果工作有体会的话。

第三,要写一本书。从无到有怎么写,脑子空空的是写不出来东西的。因此必须要有实际研究的体会和知识积累。

为此,我要做一个自己感兴趣的科研项目。我们当时是有任务的,在做银河机的时候是分配任务的。当时是没有自由选择的,不是想干什么就能干什么的。但是我想搞科研还是要自主选择的,自己给自己立课题。我从 1980 年开始对人工智能比较感兴趣。有兴趣的原因是在读书期间看过图灵机资料,当时我非常好奇,图灵机是万能机,虽然简单,但什么计算都可以,5 条指令可以做任何事情。图灵就主张人工智能,提出有名的图灵实验。这对我启发很大,就是将来的机器一定是智能化的,看来人工智能这个方向是值得重视的。单位分配的任务要服从,我个人也可选择感兴趣研究方向。

 

学生:老师很有眼光,应该是 30 多年前,你研究的是现在最火的。百度最近在硅谷成立了一个专门做这个人工智能的机构。

胡教授:当时我们一边研究人工智能,一边教授人工智能课程,采用 LISP 语言。后来强调逻辑语言 prolog。LISP 语言是别人创造出来的,我对逻辑语言感兴趣,那时在国内,prolog 还没有出来,我就自己搜集材料,写了一个小的模型,用 LISP 语言解释逻辑语言,解释器,量不是很大,可以演示。这是没有项目的,纯属个人兴趣。后来碰巧遇到一个事,五代机。日本在 80 年代初搞了一个计划,认为下一个方向是第五代计算机。86 年,国家正好搞了一个 863 计划。在 863 计划之前,国防科技大学我们当时的系主任鼓吹搞五代机,与日本竞赛。这是当时的背景。当时叫五代机,后来叫智能机。搞研究要特别注意方向的选择问题。我搞逻辑语言,使我有机会第一批参加 863 计划的,其中有一个项目就是逻辑语言,prolog 解释器。搞了不是一次,前后有两次。不过一次是解释型的,另一次是编译型的,后者的解题速度要提高一个数量级。在这个基础上做知识库,逻辑规则作为知识的表达方式。知识推出知识,推理机有了,把知识加进去就变成知识库。在这基础上我就写了一本书。书本内容就是来源于我在研究中获取的知识以及我自己的体会,我的第一个愿望算是实现了,第二个也是,通过自我研究找到研究方向。第三个写文章的愿望也实现了。当时写文章还算比较多的,在计算机学报,软件学报等刊物上发表。所以,那几年还是有点收获。

可能你们要问道我为什么要回到复旦来,这主要是家庭问题。在国防科大工作还是很有趣的,我自己也有点成就感。但是当军人在 50 岁就是一个关口,50 岁前可以要求转业,需要经过批准。50 岁前如果不转业,必须要等到退休后才能离开部队。我提出申请时是 49 岁,主要是孩子的就业问题。回复旦虽然在待遇方面以及对正在研究的工作有点损失,但到哪里都是为党工作。家庭确实有困难,后来领导同意了。

 

学生:您算是军人吧?您在复旦算是军衔最高的吧?

胡教授:我在部队没有军衔,是文职军人,有技术级别,转业时是技术 7 级,待遇相当于上校。1998 年,上海搞预备役,被任命为预备役大校军衔。

 

学生:您能再和我们说一下您的研究领域吗?

胡教授:大方向是软件。具体的我偏向于人工智能。但不同的阶段都在变。开始是做推理,逻辑语言,推理机,到知识库。后来是非常规的逻辑推理,非单调推理,不是一阶谓词逻辑推理。其界限是对世界的看法。认为世界是封闭的,就是常规的逻辑推理,认为世界是开放的,结论可能会在知识范围之外,就是非单调逻辑。后来我们研究非单调逻辑推理,我还得到一个奖项,国防科委的科技进步一等奖,1994 年给我的。因为一等奖要经过反复的评。迟后了好几年。然后就是专家系统,有了知识,有了推理,有了专家知识,有了界面,就是专家系统。到了复旦以后,开始还是这个方向,要配合国防科大的项目结尾工作。我在复旦这边也申请到一个自然科学基金项目,1991 年批准的,我就在复旦做。方向和过去是一致的,但我到了这里后方向是数据库。因为当时这里没有人工智能研究室,数据库和知识库比较靠近,我就参加了数据库研究室。但是在关系数据库领域,我和他们比算是起步比较晚了,属于后来者,因此我还要花很长时间。为了不拖在后面太久,我就想做文本数据库,就是把所有文章放在一起,对象就是全文集合。不像关系数据库实现要把数据整理好。知识载体基本就是文本。所以价值也大。后来还研究了数据挖掘。文本里面又有内容安全,又和安全相关了。我在这里的研究范围相当广。文本内容安全后来一直做到 2001 年。后来有一个内容安全相关的重点课题。任何一个课题,抓住方向后,都有广泛的联系,都能够串起来。

 

学生:胡教授,您能谈谈您从事数字图书馆方面研究的体会吗?

胡教授:我也参加过一项施伯乐教授主持的数字图书馆课题。我申请的研究课题是文本数据库,也被批准了,文本数据库是数字图书馆项目的一个子集。后来国家网络安全中心等单位也批给我几个相关项目。再后来和上海市的信息中心,互联网中心和市政府做了几个网上项目,里面都包含文本文本数据库内容。这项工作,做了好几年,从 1998 到 2005 年。大部分是 863 项目的,也有国家自然科学资金重点项目或上海市的项目,尾巴拖到 2011 年。我退休是 2005 年。

我有一点体会,对你们可能也会有好处,不要把研究的点放的太宽泛,就是要把某一点研究透。由于研究了全文数据库,帮助我后来提出了互关联后继树数据模型。1998 年去美国回来经过香港理工大学,看了一本资料,关于全文检索模型的,提到 Pat 数组模型,这是一种新型的索引模型。当时国内只看到倒排表模型。我们也是做倒排表模型,从压缩度角度看,结果还可以。有一个学生帮忙做的,把全文索引压缩的很小,但是查询速度还不是很快。我看了那个资料后很好奇,是否还有更好的办法。我发现就是 Pat 模型也有缺陷,还有改进的余地,于是就提出了互关联后继树模型。它的优点是又小又快。过去索引模型的矛盾是要么很大,如倒排表,大而不快;要么快但不小,如 Pat 模型。有没有既快又小的模型?这其实是个很深的问题:即程序复杂性和计算复杂性关系问题。计算复杂性关系到时间,程序复杂性关系到空间,两者是矛盾的。怎么统一呢?把两者统一起来,至今还没有先例。我从数据的结构与拍排序入手逐步演变到互关联后继数树这个模型,在一定意义上实现又小又快这样的目标。研究这个问题花了很长的时间 (大约 7~8 年),就是想通过这个实例把两个复杂性统一起来。后来通过演算证明了这个方法可以做到最小也最快。当然,这个问题还可以有许多拓展,例如把它拓展到数据挖掘,关系数据库,或逻辑推理等方面去,甚至与知识库联系在一起。知识库思想是很好的,过去之所以没有得到推广,是因为实用性不行,根源是没有很好的索引系统。和关系库相比,关系库有平衡树 B+树,帮助它解决很多问题,能加快查询。但知识库没有。知识库中知识基本是并列的,很慢,过去在推理时有个模型叫做 “沃伦模型”(音译),把第一个参数进行索引的话,会加快推理速度。这是沃伦在做博士时写的一篇论文。过去我们做过沃伦模型的编译系统。他是根据第一个是常数的第一个参数,来做这件事情,这样局限性太大。有了互关联后继树,我们就可以把它推广大到所有参数,甚至把参数作为全文这样一般形式,那么就可以加快整个知识库的推理。这个思路我提出来,在我的一本书中专门写了一章。我现在没有学生了,没办法实现它。对于你们年轻人来说是很有意义的,一旦突破了,是带有方向性的。

 

学生:老师您既是一个研究者,又是老师,传道授业解惑,那您在复旦当老师有什么故事或者心得?

胡教授:我觉得一个是做人,必须要诚实做人,认真做事。所有行业都一样。我自己这么做,对学生也是这么要求的。第二是师生平等关系,做课题的时候不可能什么都是我做,一个人只能做一件事,才能做得深。我做科研也一样,我和学生之间是朋友关系,是合作者的关系。课题的发起阶段我可能想得多一点,后来主要靠学生。做科研主体是学生。学生有时候是被动,不知道为什么这么做,但是没有他们做是完不成的。后来他们可能慢慢有体会了,我觉得和学生是一个教学相长的过程。

还有在工作方法上就是抓住一点深入突破,不能够贪多。做什么事都一样,要么不做,要做做到底。我的经历就是这样,第一个课题 (数字指挥仪) 做了 8 年,然后银河机做了 5 年,然后逻辑推理也有十年。还有这个索引模型,光一个问题我想了 7~8 年,从计划到出书差不多用了 10 年。所有相关部分都想到了,这样自己才有更深的体会。不要东做一下,西做一下。我最好的学生叫张锦是复旦毕业的,在我这里做硕士博士,现在在 EMC 总部 25 万美元年薪。还有一个学生在南京信息大学当院长,还有几个学生早当教授等等。

 

学生:请老师谈一下对现在的大学生有什么好的建议和希望。

胡教授:第一点,我们这一辈有一个缺陷,起步太晚。有这么一句话,道大天大地大人也大,任何一个人能力都是无限的,关键是发挥出来。从思想角度,人可以比天还大。任何时候,人都要自强不息,哪怕能力不行,认真做一件事,也可能取得成就。能力大的人不专注一件事也可能没有成就。这就是区别。能力确实有大有小,但是我觉得关键是一个人是否专注。一旦专注之后就不要计较条件,经济条件,这个无所谓。就是让你养一个家庭也要不了多少钱。就是赚的再多也不嫌多,乱花再多也不够。不乱花的话,就是吃饭穿衣睡觉几件事。最基本的需要是不需要多少钱的,没必要计较待遇,关键是把事情做好,对学生也同样适用。一个人要诚实,不要投机取巧,把别人好的拿过来,当成自己的,那没意义。一定要诚实,没有就没有,能做一点就做一点。特别是在学校里,一定要沉下心来,不要计较一时的得失。在公司里也是这样。把自己的事做出来,别人也会看到的。

 

学生:退休以来除了科研写书,平时还做些什么?

胡教授:退休主要是两件事情,一是老有所养,我们这一代年轻时比较辛苦,包括工作时负担还是很重的。我们甚至耽误一段时间,起步时三四岁了。你们是 20 多岁,相差十五年。有段时间,我们实际上休息时间很少,我几乎没有休假。现在就是要老有所养,顺天时尽人和,冬天到海南岛,夏天到威海,春秋在上海。和家人多团聚。亲戚多走动,老同学老同事经常会面。另一个就是老有所乐,我的观念和其他人不一样,我的玩就是能够想一些感兴趣的问题,过去 5 年写了一本书,我准备到 80 岁之前再写一本书。我认为这是乐。为什么呢。过去有很多见解和体会,精力不如你们年轻人,但有时候联想能力还要可以。能够想一些问题,我认为很有乐趣,做自己感兴趣的事才是真正的快乐。最近我在研究密码,有的密码是数论问题,如 RSA 算法一般认为是不可突破的一件事。过去说的是 RSA 是大数分解,大数分解没有办法解决,所以 RSA 不能破。但是如果不用大数分解,其它方法行不行?比如直接计算欧拉数。现在有初步结果,但不能确定。要反复研究,没有任务没有时间压力,有结果更好,没有结果也是乐趣。很多数论问题,以前下的结论不一定对。如无法将素数公式化,我觉得可以为素数建立一个递推公式,然后在此基础上,研究素数的西性质。我现在有时间就想想一些自己感兴趣的问题,或做一点自己感兴趣的事,这样自己才能感到快乐。

 

学生:您来复旦,计算机学院还没单独成立,请您谈谈对计算机学院的展望、看法和建议好吗?

胡教授:以前没做过领导工作,没有什么体会。我感觉必须注意对老师和学生素质的培养,把老师和质学生的素质培养起来了,将来一定能在国内能站住脚的。我觉得这点院里还是有潜力可挖的。比如说,怎么鼓励老师。现在提倡申请国家课题,但这毕竟是有限的。能申请到国家课题的人不是那么多,大多数申请不上。我认为大多数青年教师都有很强烈的要求,做研究的。有愿望,要给他条件。我在国防科大研究 prolog 语言的时候,别人未重视,但我有兴趣。东西做出来别人知道了,就支持了,在校內先给我立项了。后来我还申请到 863 课题,这就叫支持。这里面有两个问题。一是怎样鼓励青年教师和学生,能够自立课题。这个是要加强管理的,不是让他自生自灭。管理是要不断了解他们在想什么,有问题吗,没有问题能否给予某种启发,让他想问题。有问题的,是在想哪些问题。有进展的时候,应该把系里的资源适当分配一点给他,5000 元也行,对他来说就是很大的鼓励。过去经常发一点东西或者吃饭,价值不大,但是把钱省下来,哪怕每人几百块钱,加起来也很厉害了。然后有意识的分配给有想法有结果的人。开头不扶持,后来他会一直很被动,一直没课题。还要末尾淘汰,搞得老师负担特别重,冷板凳也坐不下去了,要被淘汰掉。这样不利于队伍的成长。希领导要有意识的鼓励挖掘老师们的创意,没有创意怎么搞都不行。第二点我觉得学生要早点研究问题,很多人在中学大学就开始想问题了。我们做习题不是解决问题吗。习题能解决,如果我们脑子带点问题研究的话也能解决。很多问题不是一定要高等数学,不得了的知识,很多初等数学就够了。国外很多学生出成果的比较早,牛顿大学里就写论文了。不是三四十岁开始,晚的不得了。我觉得学生心里要经常想一些问题,就是当前在研究什么东西。学生感兴趣的话也可以研究。还有就是学生自己在想什么问题,把他收集起来,统一管理。那些学生经常有想法,有内容,就要加以鼓励。这样学生早出成果。我觉得这两条做的还是不够的。等老师申课题,等老师出成果,不主动挖掘,学生也是这样。比如可以成立许多兴趣小组。退休老师有些也是有想法的,我们系里有个老师,他发了一封邮件说要搞一个语言,像积木一样拼出一个程序。这是一个非常好的想法,一旦成功影响很大,想要一个兴趣小组,带几个学生。在兴趣基础上相互讨论,学生成长快,老师也得到了帮助。能够挖掘院里老师和学生的人力资源,这个值得一做。做个几年下来就有效果。我刚到复旦的时候还没有研究生,在国防科大时候有但是是军人不能跟来,当时就找本科生,二三年级,来复旦后的第一个课题就是本科生帮忙做完的。完全可以做,就是老师要辅导一下,做都是学生做。我举例就是想说大学生的潜力还是很大的,特别是复旦学生的资质很好。

 

学生:今天胡教授与我们进行了深入的访谈,您的谈话使我们受益非浅,特别是 “道大天大地大人也大” 这句话,更是至理名言,我们将会受用终生。谢谢您!

胡教授:不用谢。我很喜欢与同学们交流。再见!

学生:再见!非常感谢谢胡教授!

胡运发教授在为自己编著的书签名,准备赠与学生

胡运发教授(右 2)与访谈学生合影