jsoup带cookies(jsoup是什么意思)

本文目录一览:

Jsoup发送http请求,get和post两种方式,分别带参数和不带参数

dependency

groupIdorg.jsoup/groupId

        artifactIdjsoup/artifactId

version1.10.3/version

/dependency

public void JsoupGet() throws Exception{

Connection connect = Jsoup.connect(“;password=lisi”);

// 带参数开始

connect.data(“username”,”zhangsan”);

connect.data(“password”,”lisi”);

// 带参数结束

Document document = connect.get();

System.out.println(document.toString());

}

public void JsoupPost() throwsException{

Connection connect = Jsoup.connect(“;password=lisi”);

// 带参数开始

connect.data(“username”,”zhangsan”);

connect.data(“password”,”lisi”);

// 带参数结束

Document document = connect.post();

System.out.println(document.toString());

}

求真正有效的可以模拟登录新浪微博的java代码,后续可以用Jsoup进行抓取。急急!!登录成功马上给分!

package jsoupTest;

import java.io.IOException;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import org.jsoup.Connection.Method;

import org.jsoup.Connection.Response;

import org.jsoup.Jsoup;

public class JsoupTest {

  public static void main(String[] args) throws IOException {

    MapString, String map = new HashMap();

    //map.put请根据自己的微博cookie得到

    Response res = Jsoup.connect(“别人的主页id”)

        .cookies(map).method(Method.GET).execute();

    String s = res.body();

    System.out.println(s);

    String[] ss = s.split(“scriptFM.view”);

    int i = 0;

    // pl_content_homeFeed

    // pl.content.homeFeed.index

    ListString list = new ArrayList();

    for (String x : ss) {

// System.out.println(i++ + “======================================”);

// System.out.println(x.substring(0,

// x.length()  200 ? 200 : x.length()));

// System.out.println(“===========================================”);

      if (x.contains(“\”html\”:\””)) {

        String value = getHtml(x);

        list.add(value);

        System.out.println(value);

      }

    }

    // content=ss[8].split(“\”html\”:\””)[1].replaceAll(“(\\\\t|\\\\n)”,

    // “”).replaceAll(“\\\\\””, “\””).replaceAll(“\\\\/”, “/”);

    // content=content.substring(0,

    // content.length()=13?content.length():content.length()-13);

    // System.out.println(Native2AsciiUtils.ascii2Native(content));

  }

  public static String getHtml(String s) {

    String content = s.split(“\”html\”:\””)[1]

        .replaceAll(“(\\\\t|\\\\n)”, “”).replaceAll(“\\\\\””, “\””)

        .replaceAll(“\\\\/”, “/”);

    content = content.substring(0,

        content.length() = 13 ? content.length()

            : content.length() – 13);

    return Native2AsciiUtils.ascii2Native(content);

  }

java的Jsoup登录有验证码网页获取登录后的cookie

首先是jar仓库:

dependency

groupIdorg.seleniumhq.selenium/groupId

artifactIdselenium-java/artifactId

version[3.0.1,)/version//获取最新的版本库

/dependency

dependency

groupIdorg.jsoup/groupId

artifactIdjsoup/artifactId

version1.8.2/version

typejar/type

/dependency

代码:

public static void getIndex2() {

//之前运行程序发现生成了N多个chrome driver进程,搞不懂为什么会有那么多进程产生,网上查了下,说起这个service有用,拿来试下,效果未知

ChromeDriverService service = new

ChromeDriverService.Builder().usingDriverExecutable(new

File(“./driver/chromedriver.exe”)).usingAnyFreePort().build();

try {

service.start();

} catch (IOException ex) {

Logger.getLogger(kechengbiaoIndex.class.getName()).log(Level.SEVERE, null, ex);

}

//end

//正式开始

//先定义浏览器驱动,我用chrome浏览器,网上下载一个chromedriver.exe,启动时需要加载

System.getProperties().setProperty(“webdriver.chrome.driver”, “./driver/chromedriver.exe”);

Jsoup或者HttpClient抓取web页面时,data,userAgent,cookie(),timeout(),post();为什么要设置这些?

userAgent让服务器感觉访问者更像一个真实的浏览器在访问,cookie是看服务器需不需要,timeout还需要解释吗,你不设置有一个默认的超时时间

原创文章,作者:NIIU,如若转载,请注明出处:https://www.506064.com/n/140614.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
NIIUNIIU
上一篇 2024-10-04 00:24
下一篇 2024-10-04 00:24

相关推荐

  • JavaScript清除Cookies的方法

    一、什么是Cookies Cookies是一种存储在用户计算机上的小文本文件,最初是为了方便用户在Web网站之间传递信息而创建的。每当用户访问Web站点时,Web服务器就会通过HT…

    编程 2025-01-20
  • js如何读取cookies里面某一个指,js如何获取cookie的值

    本文目录一览: 1、如何用js获取cookie中存储的值 2、js中如何获取cookies中的键值的值 3、如何使用js来获取cookie的值 4、jquery怎么读取cookie…

    编程 2025-01-09
  • jsoup获取headercookie,jsoup获取标签内容

    本文目录一览: 1、求真正有效的可以模拟登录新浪微博的java代码,后续可以用Jsoup进行抓取。急急!!登录成功马上给分! 2、怎么用网络爬虫获取数据基于java的 3、java…

    编程 2025-01-05
  • php怎么写cookies(PHP怎么写fanclab)

    本文目录一览: 1、php cookies值怎么写 2、PHP中如何使用Cookie 3、在php中怎么设置cookie 4、请教如何使用php 写入cookie到指定的文件名中 …

    编程 2024-12-28
  • php之cookies小练习,php中cookie的使用

    本文目录一览: 1、PHP中如何使用Cookie 2、如何使用PHP操作cookie 3、PHP中cookie和session的区别实例分析 PHP中如何使用Cookie 比如设置…

    编程 2024-12-22
  • 使用Flask-Session管理Cookies

    一、Flask-Session是什么? Flask-Session是一个集成Flask和Python的Session支持的扩展,通过使用它,可以轻松地管理浏览器中的Cookies。…

    编程 2024-12-22
  • jsoup填充cookie获取数据,jsoup设置cookie

    本文目录一览: 1、java的Jsoup登录有验证码网页获取登录后的cookie 2、如何用js向cookie中保存数据,取数据。 3、如何用js向cookie中保存数据、取数据?…

    编程 2024-12-17
  • JSoup在Web页面解析中的应用

    一、JSoup教程 在Web开发中,经常需要对HTML页面进行解析和操作,而JSoup正是一款强大的Java HTML解析器,它可以方便地从一个HTML文件中提取所需的数据,并且支…

    编程 2024-12-12
  • javajsoup用法(java jsoup)

    本文目录一览: 1、java jsoup怎样爬取特定网页内的数据 2、java怎样读取html文件 3、java使用jsoup采集网站数据 4、详解如何基于Java用Jsoup爬虫…

    编程 2024-12-12
  • js页面如何设置cookies,javascript怎么设置

    本文目录一览: 1、如何用js修改页面cookies 2、js 怎么重新设置cookie 3、怎样用jquery来设置cookie 4、怎么设置整个网站的cookie js 5、J…

    编程 2024-12-12

发表回复

登录后才能评论