各位大佬,我想用PYTHON做一个文档识别的功能,就是将文档中特定的列数的数据在GUI中显示。
数据的规律是这样的:每8列为一个数据块,1(1-8列),2(9-16列),3(17-24列)。。。。。。
依次识别每块的数据,如果块为空也要识别。因为不同的情况也许就会有数据。
需要提取MAT1 PBEAML EIGRA这些行的后面的数据。
用上次才老大哥的方法,
re.findall(r'\d+\.?\d*',a)
a='EIGRA 1 0.0 200.0 MASS'
这样提取的列表包含了数字数据,但不能体现在哪列了。
请问有大佬可以详细做个解答吗?正则表达式是否有按列提取数字的呢?