百度笔试题1

来源：百度文库编辑：神马文学网时间：2024/04/27 14:24:19

1）此题10分
对任意输入的正整数N，编写C程序求N!的尾部连续0的个数，并指出计算复杂度。如：18！＝6402373705728000，尾部连续0的个数是3。
（不用考虑数值超出计算机整数界限的问题）
2）此题10分
编写一个C语言函数，要求输入一个url，输出该url是首页、目录页或者其他url
如下形式叫做首页：
militia.info/
www.apcnc.com.cn/
http://www.cyjzs.comwww.greena888.com/
www.800cool.net/
http://hgh-products.my-age.net/
如下形式叫做目录页：
thursdaythree.net/greenhouses--gas-global-green-house-warming/
http://www.mw.net.tw/user/tgk5ar1r/profile/
http://www.szeasy.com/food/yszt/chunjie/
www.fuckingjapanese.com/Reality/
请注意：
a） url有可能带http头也有可能不带
b）动态url（即含有"？"的url）的一律不算目录页，如：
http://www.buddhismcity.net/utility/.../details/3135/
http://www.buddhismcity.net/utility/.../details/2449/
另：如果你会linux，请用linux下的grep命令实现第2题的功能（附加5分）。
3）此题40分
如果必须从网页中区分出一部分"重要网页"（例如在10亿中选8亿），比其他网页更值得展现给用户，请提出一种方案。
4）此题40分
假设有10亿网页已经被我们存下来，并提供如下信息：网页全文（即网页的源码）、全文长度、网页正文（即网页中提取的主体文字）、
正文长度，以及其他网页提取物等，现在希望去掉其中的重复网页，请提出可行的方案，计算出每个网页对应的重复度，你可以自己
对网页重复下定义，也可以提出需要哪些更多的网页提取物来实现更好的去重复方案

百度笔试题1 百度笔试百度笔试百度笔试一道百度笔试题的解决方案透露百度校园招聘笔试题透露百度校园招聘笔试题一道百度笔试题的解决方案百度（Baidu）历年笔试题百度笔试感受百度笔试感受腾讯笔试题1 百度的在线笔试题目 1华为笔试题（有答案）百度笔试 - 专注于搜索引擎技术(Lucene,Nutch) - DonewsBlog 百度笔试 - 专注于搜索引擎技术(Lucene,Nutch) 百度笔试 - 专注于搜索引擎技术(Lucene,Nutch) - DonewsBlog synopsys笔试题 via笔试题腾讯笔试题腾讯笔试题 again C++笔试题腾讯笔试题网易笔试题 @ 阅微堂