Re: [边缘] 当初

楼主: qazasdfg15 (qazasdfg15)   2024-03-23 09:19:54
※ 引述《qazasdfg15 (qazasdfg15)》之铭言:
: 不该java和c++的
: 听说c# python angular好写很多
: 有垃圾回收机制 好像没pointer
: 人家已经vs2022 windowsserver
: 我还在ubuntu上喂猪公
: static Response *post(Request *);
: 话说python值得学吗 能结合AI很方便的样子
写了个ptt简易版爬虫
版权没有 要存成py档才能用喔哈哈XD
# 要引入才能用
import json, bs4, random, time, requests
# ptt domain name
domain = "https://www.ptt.cc"
# ptt route 换页用
route = "/bbs/Marginalman/index.html"
# ptt jsonList 给jsonfile存盘用
jsonList = []
# 爬个约200笔左右
for i in range(10):
# 把url组合起来
response = requests.get(domain + route)
# BeautifulSoup解析
result = bs4.BeautifulSoup(response.text, 'html.parser')
# ptt的标题们在r-ent元素
article = result.find_all('div', class_ = 'r-ent')
for j in article:
jsonDict = {}
title = j.find('a').text
author = j.find('div', class_ = 'author').text
timestamp = j.find('div', class_ = 'date').text
url = domain + j.a['href']
# 印出标题 作者 发文时间 网址
print("标题=>", title)
print("作者=>", author)
print("发文时间=>", timestamp)
print("网址=>", url)
print("
作者: SydLrio (狂岚嘴砲)   2024-03-23 09:22:00
py统治世界

Links booklink

Contact Us: admin [ a t ] ucptt.com