大家好,我是青花,本篇给大家分享一下《通过Java+Selenium查询文章质量分》。
环境准备
浏览器:本篇使用的是ChromeChrome驱动版本:113Java版本:Jdk8selenium版本:1
查询文章质量分
修改pom.xml配置
配置Chrome驱动
public final static String CHROMEDRIVERPATH = "/Users/apple/Downloads/chromedriver_mac64/chromedriver";
System.setProperty("webdriver.chrome.driver", SeleniumUtil.CHROMEDRIVERPATH );// chromedriver localPath
引入浏览器配置
WebDriver driver;
ChromeOptions chromeOptions = new ChromeOptions();
设置无头模式
chromeOptions.addArguments("--headless")
chromeOptions.addArguments("--remote-allow-origins=*");
启动浏览器实例,添加配置信息
driver = new ChromeDriver(chromeOptions);
访问质量分地址
窗口设置
chromeOptions.addArguments("–no-sandbox"); //--start-maximized
定位到输入框并输入博文地址
//定位到输入框
WebElement inputSelectE = driver.findElement(By.cssSelector("input.el-input__inner"));
//输入文字地址
inputSelectE.sendKeys(blog_url);
定位到查询按钮并点击
//定位查询按钮
WebElement qcSelectE = driver.findElement(By.cssSelector("p.trends-input-box-btn"));
//点击查询按钮
qcSelectE.click();
强制等待1s,并转换为jsoup文档处理
SeleniumUtil.sleep(1000);
获取右边区域 -- 文章质量分结果区域
WebElement mainSelectE = driver.findElement(By.cssSelector("p.csdn-body-right"));
//转化为Jsoup文档处理
Document doc = Jsoup.parse( mainSelectE.getAttribute("outerHTML") );
1获取博文标题
String title = doc.select("span.title").text();
1获取博文作者和发布时间
String posttime = doc.select("span.name").text();
1获取博文质量分
String score = doc.select("p.img").text();
1获取博文质量分建议
String remark = doc.select("p.desc").text();
1打印结果
log.info("文章标题:{} , 作者和发布时间:{} , 质量分:{} , 博文建议:{}" , title , posttime , score , remark );
1效果
文章标题:《项目实战》构建SpringCloudalibaba项目,作者和发布时间:-青花锁·2023-06-2118:20:46-,质量分:86,博文建议:文章质量良好
代码
单篇查询文章质量分至此结束
文章为作者独立观点,不代表股票自动交易程序化数据接口观点