当前位置:wayQQ空间站 > 知识问答 > 文章内容

python去重后进行相关列数据统计

网站:http://wayqq.cn┊类别:知识问答┊时间:2018-07-06 22:27:32

python的速度效率是不高的,如何对速度要求比较高的话建议可以用c来写。例如:


a=[] #初始化要用到的列表a,用于记录原始行信息


b=[] #初始化要用到的列表b,用于记录结果数据,由两项构成。前一项为行信息如“小


明:90”,后一项为该行对应的出现次数如2


f1=file("1.txt", "r") #打开1.txt文件


for line in f1:    


   a.append(line) #将1.txt文件每一行作为一个元素,存入列表a


f1.close


for n in a: #遍历a中每一项(记为n),即1.txt中每一行


    flag=1    


for i in range(0,len(b)):        


if n == b[i][0]: #n与列表b中的每一项对比,如果有相等的:

           b[i][1]=b[i][1]+1 #那么对应的出现计数加1

          flag=0

          break   


 if flag==1: #如果前面的比对没有一个相等的,即该行是第一次出现:

       b.append([n,1]) #那么在列表b中添加改行为新的一项


f2=file("2.txt", "w") #打开2.txt文件,用于输出


for n in b: #输出格式为:行信息 (tab) 出现次数 (回车)


    f2.write(str(n[0][0:-1]) + "\t")


    f2.write(str(n[1]) + "\n") 


f2.close


print "Finished" #完成

为您推荐
精品图片推荐
关于本站 | 广告服务 | 版权声明 | 友情链接 | 网站地图 | 返回顶部
小刀娱乐网 qq资源网 小刀在线 爱上资源网 qq乐园 qq技术网站 小偷娱乐网 爱q生活网 爱q生活 qq技术乐园 qq业务乐园首页 钻石皇朝 小K娱乐网
WAYQQ空间站www.wayqq.cn 版权所有 Copyright © 2007-2018 QQ业务乐园. All Rights Reserved . 鄂ICP备12017691号 鄂公网安备42060202000014号