9月份文章:lucene,nutch,SQL,导入导出,软件需求

来源:百度文库 编辑:神马文学网 时间:2024/04/28 06:33:23
2007年09月17日
 学习搜索开发的重点不在lucene和nutch[ 原创]
摘要:而:现在已经有这个开源的东东,如果你要仔细研究lucene并试图写一个C++的版本,那不是不可以,而是耗费可以说十年之功的事情(cutting已经耗费7年了,而且前提他早就是作这个技术的人),当然你也不会从java版本开始去研究,而会从基本原理+CLucene研究开始,而至于java版的有速度的说法,当然你再试图研究除c++,java版本以外的版本毫无疑义,为什么呢?因为剩下的都是无法跨平台(如C#)或者解释执行的(perl,ruby等)。更谈不上改进效率了,甚至有些版本搞出空实现来,不害死你我不信。    ——点击此处阅读全文
发表于 @2007年09月17日 19:59:00 |评论(0) |
 推荐文章:关于搜索引擎及其开发(推荐http://blog.csdn.net/xwjbs)
摘要:关于搜索引擎及其开发 xwjbs终于写出了我们关注的point,细节方面,看各人造化. 反正文章对我学习帮助很大。谢谢请至此处浏览: http://blog.csdn.net/xwjbs/archive/2007/09/16/1787264.aspx    ——点击此处阅读全文
发表于 @2007年09月17日 14:21:00 |评论(0) |
2007年09月16日
 广东2007新登记软件产品清单(转载)
摘要:偶然想法是看看别人都开发了什么新产品,再来看看自己适合作什么。//最关键是找到自己适合的,适合自己的,有需求的,并且最起码的,以自己的经验能完成的。这个清单你可以看到什么样的软件的生命周期长,哪些比较短,比如pos,cti比较长,而智能建站这个好象不吃香了。//如果你能找更多时间范围内的清单来分析,会更好。你可以以这个关键字搜索:2007广东注册软件产品清单    ——点击此处阅读全文
发表于 @2007年09月16日 14:35:00 |评论(0) |
 Datawindow无处不在:datawindow in java(转载)
摘要://转载加注:datawindow经过我三年的使用,是如此方便快捷。虽然powerj不在使用,但现在pb11和datawindow.net再显风光。datawindow以控件的面目出现在.net里,可以说真是无处不在。如此简单好用的东西很多人不用,上次我一个朋友居然试图给一个同学提供delphi版的report tool for PB,让我"痛斥"了一番。归结其原因,还是sybase没宣传好。可以说任何程序,特别是java这样的不长于UI编写的语言,在jBuilder和datawindow的作用下,还是很容易写一个界面和数据操作的。    ——点击此处阅读全文
发表于 @2007年09月16日 12:42:00 |评论(0) |
2007年09月15日
 2006年中国软件收入规模前100家企业名单(转自sina)
摘要:2006年中国软件收入规模前100家企业名单    ——点击此处阅读全文
发表于 @2007年09月15日 15:58:00 |评论(0) |
2007年09月12日
 关于SQL的char,varchar字段在导出时切断中文字符显示问号或乱码的问题[原创]
摘要:本地表加宽成varchar(40),导出是增加一个“A-Z”的字符,如果后面有半个字符则结合成一个字或者问号,从而不会与逗号结合。如果没有半个字符则显示出这个英文,影响也不大。我在sql2000里测试:专线(半个字)变成了专螦如果末尾加英文的空格,显示比较贴切,有半个字符的显示为问号,但不吃掉逗号,而正常的记录只是多一个空格出来,完全不影响实际上使用。    ——点击此处阅读全文
发表于 @2007年09月12日 20:05:00 |评论(0) |
2007年09月09日
 我的未来发展之路和我的技术准备[原创]
摘要:这个说一下我的感受,几年前有人说OA会流行,我不以为然,而今天,卖得好得软件可以卖到5000份,别人的确赚钱了。自己得判断太落后。昨天有人说在作一个CTI for 餐饮的单子,我还是不以为然。后面我想了想,我不是一直认为中国的信息化路子很长吗?电讯这些牛客户的确是率先用上CTI的,但是现在我们也可以看到更多的中小规模企业,特别是通过ISO认证的具有先进管理经验的公司正在逐步电脑化和管理升级,一些以前都死掉一次的软件系统,它们之所以死掉一次,在于它们梦想中国一夜之间都完全资讯化,而实际的生产和管理的进步不是那么快,特别是电脑化有个需求急迫性和门槛的问题。但是我可以推断并相信,一些过去没赚钱或者死掉的软件,在中国资讯化过程中,还将卷土重来。比如CRM,仓储管理,CTI,这些会像电脑进入管理的方方面面一样,会在中国的资讯化过程中呈现出很大的需求。    ——点击此处阅读全文
发表于 @2007年09月09日 14:51:00 |评论(0) |
2007年09月08日
 导入导出:数据库导出Txt文本文件格式校验[原创]
摘要:因为客户导入的数据经常有一些错误,为了自动检查文件而开发20070907 parm:文件所在路径 体积限制(M为单位) cmd: java com.cttmis.checktxt 目录 体积限制(300) 异常一:行数据不完整。校验逗号分隔符号(,)的数量是否一致。(中间折行的也能校验出) 异常二:存在空行    ——点击此处阅读全文
发表于 @2007年09月08日 07:50:00 |评论(0) |
2007年09月02日
 中国剩余定理:一类初数题的通用解法(除数,余数问题)(转载)
摘要:我国古代数学名著《孙子算经》中,记载这样一个问题:“今有物不知其数,三三数之剩二,五五数之剩三,七七数之剩二,问物几何。”用现在的话来说就是:“有一批物品,三个三个地数余二个,五个五个地数余三个,七个七个地数余二个,问这批物品最少有多少个。”这个问题的解题思路,被称为“孙子问题”、“鬼谷算”、“隔墙算”、“韩信点兵”等等。    ——点击此处阅读全文
发表于 @2007年09月02日 11:56:00 |评论(0) |
 Lucene(Nutch)距离商业文本搜索引擎还有多远?(转载)
摘要:最新一次更新的时候,我再次研究了一下Lucene,读完了Lucene In Action,并且实际的使用Lucene构建了一个小型的搜索系统之后,我感觉到很惭愧,因为我一直对Lucene有不满的心理,认为它做的不好(可能受了国内的某些使用Lucene构建搜索引擎的网站的影响,因为他们构建的都很差,现在想来,可能是他们和我一样没有真正深入理解Lucene)。现在我才发现,Lucene的作者在大方向上考虑问题的全面比我要好很多(虽然有些功能我不知道是否真的有用)。    ——点击此处阅读全文
发表于 @2007年09月02日 08:45:00 |评论(0) |
2007年09月01日
 关于lucene发展和多语言实现的方向(转载)
摘要:Erik的观点: 1、最好利用类似PyLucene 的方式来实现lucene的多语言化。 2、Lucene 1.9/2.0 将会发生重大变化。(我正在翻译中)多语言的lucene,要么很难在时间上和java lucene保持兼容,要么迁移到多语言的过程很辛苦。每个commit,你都需要跟踪,然后修改......     ——点击此处阅读全文
发表于 @2007年09月01日 21:10:00 |评论(0) |
 PB开发笔记(连接)
摘要:PB开发笔记(1-8)    ——点击此处阅读全文
发表于 @2007年09月01日 10:15:00 |评论(0) |
 评论:关于联想在开发一个关于农业的专业垂直搜索引擎[原创]
摘要:如果某个农村地区,经济发展得不错,无外乎几个方式:工业化或农业产业化,剩下的没有生气的地区,还是小农意识很强,农村经济没找到发展思路的地区。而实现了工业化或农业产业化的农村,跟城市就没有区别。所以剩下的垂直领域不外乎农业产业化,农业基本需求,如农资,信息化等。而愿意对广告买单的实体还是不少,毕竟农业是个基本课题。比如农业机械,农资,第三产业,以及面向农村市场的一切其它特殊服务。因为面积比较广,受众比较多。还是有很好的前景。但我们看到,光是着重定位到农村或者农业题材的搜索,就足够作无数个搜索来满足需求了。    ——点击此处阅读全文
发表于 @2007年09月01日 06:37:00 |评论(0) |
 垂直搜索OR个性化推荐(转载)
摘要:转载评注:作者也持着一种垂直就是要作内容,作服务的观点,甚为赞同。就是以精品店模式抵御大卖场的威胁。我甚至定义为平面搜索是作技术的,垂直是作内容和服务的。比如人才搜索,google,baidu只会关注:职位,java,c++程序员,但他不会考虑java和c++需求的细节,而这正是垂直搜索要作好的。当然,针对信息的浏览和发布的具体需求,垂直搜索必然会接合web2.0元素和b2b,信息免费发布等元素,作到完整性服务方式。chengg0769/20070831 mark。    ——点击此处阅读全文
发表于 @2007年09月01日 06:10:00 |评论(0) |
2007年08月31日
 四年级数学题难倒家长(转载)
摘要:以下是广州市某小学四年级的数学题,面对这九道题多数家长只是叹气,少数家长也只会做二三题。愚有感现在的教育并不是在提高文化水平,而是以强硬的手段来制造中国(广州)神童。当今的小孩子的学习压力很大,特别是高中以上的学生,家长们为此操心与操劳就可想而知了。    ——点击此处阅读全文
发表于 @2007年08月31日 05:50:00 |评论(0) |
2007年08月30日
 Powerbuilder10:DataWindow调用存储器--对于造型说明无效的字符值解决办法[原创]
摘要:powerbuilder10在用存储器调用时,retrive时出现错误:造型说明无效的字符值很多网友认为无法解决问题,或者讨论众多,但未见解决之。我通过实践,在一年前即解决。当然,这个问题颇费了我一些时间。(据说原因是ODBC的不兼容问题,因为旧版本的直连方式没问题)1. 编写procedure,如pr_query2. 新增grid的datawindow,选择procedure方式,选择存储器:pr_query,选择手工设置字段。下一步,完成。3. 在界面的dw_1的事件sqlpreview中编写如下代码:    ——点击此处阅读全文
发表于 @2007年08月30日 07:27:00 |评论(0) |