最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 科技 - 知识百科 - 正文

python读取文本数据并转化为DataFrame格式的方法详解

来源:动视网 责编:小采 时间:2020-11-27 14:13:00
文档

python读取文本数据并转化为DataFrame格式的方法详解

python读取文本数据并转化为DataFrame格式的方法详解:这次给大家带来python读取文本数据并转化为DataFrame格式的方法详解,python读取文本数据并转化为DataFrame的注意事项有哪些,下面就是实战案例,一起来看一下。在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。从纯文本格式文件
推荐度:
导读python读取文本数据并转化为DataFrame格式的方法详解:这次给大家带来python读取文本数据并转化为DataFrame格式的方法详解,python读取文本数据并转化为DataFrame的注意事项有哪些,下面就是实战案例,一起来看一下。在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。从纯文本格式文件
 这次给大家带来python读取文本数据并转化为DataFrame格式的方法详解,python读取文本数据并转化为DataFrame的注意事项有哪些,下面就是实战案例,一起来看一下。

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

需要输出成“file_out”,格式如下:

数据的原格式是“类别:内容”,以空行“ ”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame #DataFrame通常来装二维的表格
import pandas as pd #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
 #读每一行
 for line in df:
 #如果这行是换行符就跳过,这里用'
'的长度来找空行
 if line.count('
') == len(line):
 continue
 #对每行清除前后空格(如果有的话),然后用":"分割
 for kv in [line.strip().split(':')]:
 #按照键,把值写进去
 dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame
输出到一个表,不要行名字和列名字 frame.to_csv('file_out0.txt',index=False,header=False)

相信看了本文案例你已经掌握了方法,更多精彩请关注Gxl网其它相关文章!

推荐阅读:

object怎么转换成float数据

python怎么处理dataframe的时间字段

文档

python读取文本数据并转化为DataFrame格式的方法详解

python读取文本数据并转化为DataFrame格式的方法详解:这次给大家带来python读取文本数据并转化为DataFrame格式的方法详解,python读取文本数据并转化为DataFrame的注意事项有哪些,下面就是实战案例,一起来看一下。在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。从纯文本格式文件
推荐度:
标签: 格式 内容 数据
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top