[问题] 将数字的部分复制贴上,并缩排?

楼主: njpp (正妹真难找)   2021-11-16 22:30:21
想问一下各位大大
https://www.cnblogs.com/hanmk/p/12747093.html
目前想要将这个网页的程式码,拿到我的pycharm 翻译器做实验
但是,整篇文章开头都有卡数字,整篇复制贴上会变成如下:
整个排版大乱~
15 # print(response.text)
16 return response.text
17 else:
18 return None
19 except RequestException:
20 print("请求失败")
21 # return None
22
23
24 def parse_html(html_text):
25 html = etree.HTML(html_text)
26
27 if len(html) > 0:
28 img_src = html.xpath("//img[@class='photothumb
lazy']/@data-original") # 元素提取方法
29 # print(img_src)
30 return img_src
31
32 else:
33 print("解析页面元素失败")
python又是很重视排版的语言,所以必须要手动一个一个删除前面的数字
但是仍然会乱掉....
想问一下,有没有好一点的复制贴上方法,可以变成:
def parse_html(html_text):
html = etree.HTML(html_text)
if len(html) > 0:
img_src = html.xpath("//img[@class='photothumblazy']/@data-original") # 元素提取方法
# print(img_src)
比较符合以上快速又简洁符合python语法的排版? 谢谢!
先贴到 NotePad++ 再转到pycharm吗?
作者: cocoaswifty (coco)   2021-11-16 23:02:00
shift+option 上下点选删整排数字
作者: lycantrope (阿宽)   2021-11-16 23:20:00
用regex findall 取代就好 ( *\d+)
作者: cuteSquirrel (松鼠)   2021-11-17 00:11:00
windows 可以用Alt+鼠标左键选垂直的前几排删掉
作者: poototo (poototo)   2021-11-17 08:29:00
notepad手动几次搜寻取代即可,练习正规
作者: papple23g (逆道者)   2021-11-18 10:52:00
作者: jennya (Jennya)   2021-11-19 23:59:00
google “pycharm column selection”就可以一次选取多行的前几个字符&一键删除,notepad+貌似也有,你可google看看然后上面的regex全都不行,要是程式码里有数字不就很麻烦,就算要用regex也是用这个“^...”,^是一行的开头的意思,使用这个regex会找到每行前三个字符,再按replaceall取代成空白即可。
作者: papple23g (逆道者)   2021-11-20 02:37:00
前三字符行数破百就不行了吧
作者: lycantrope (阿宽)   2021-11-20 10:41:00
上面regex可以增加条件吧, ^\s*\d+

Links booklink

Contact Us: admin [ a t ] ucptt.com