本文目錄一覽:
- 1、想用java編寫個代理伺服器,求具體一些思路,詳細一些,謝謝
- 2、如何用java使用代理
- 3、如何用JAVA實現一個代理伺服器
- 4、Java 中怎樣在程序中設置代理伺服器
- 5、java使用代理訪問網路的幾種方法
想用java編寫個代理伺服器,求具體一些思路,詳細一些,謝謝
在編寫代理伺服器之前,首先應該明白一點,Java的代理機制,如圖所示:
那麼Java就處於中間這層代理伺服器,代理伺服器所作的事情如下:
1、接收客戶端請求,進行處理,然後發送給服務端
2、接收服務端響應,進行處理,然後發送給客戶端
這樣,就更清晰了,Java提供了代理的API為,java.net.Proxy類。此類表示代理設置,通常為類型(http、socks)和套接字地址。Proxy 是不可變對象。
也就是說Java可以製作高級協議的代理,如 HTTP 或 FTP。也可以製作SOCKS(V4 或 V5)代理。
首先,使用到了URL類,HttpURLConnection類及其我們的代理類Proxy類。他們都位於java.net包中。
第一步:生成代理,指定埠為8888:
第二步:使用URLConnection類進行連接
第三步:打開URL,並且讀取HTML源碼
如何用java使用代理
Java中,使用proxy是通過設置java環境變數來實現的,也就是JVM的系統屬性。
我們需要設置三個屬性,proxySet proxyHost和proxyPort。
proxySet 是個boolean類型的,可以設置為true或者false,true代表使用代理伺服器。
proxyHost 是代理伺服器的IP地址
proxyPort 是代理伺服器的埠地址。
我們有兩種方法設置這種系統屬性,
一種是命令行下運行Java程序的時候,通過參數付值
一種是在java源程序中設置。
第一種方法的格式如下:
java -DproxySet=true -DproxyHost=myProxyServer.come -DproxyPort=80 MyJavaApp
第二種方法,就是直接在源程序中通過系統屬性來寫,如下:
import java.util.Properties;
…
…
strProxy=”221.15.5.67″;
strPort=”8080″;
Properties systemProperties = System.getProperties();
systemProperties.setProperty(“http.proxyHost”,strProxy);
systemProperties.setProperty(“http.proxyPort”,strPort);
….
JDK1.3以上版本,只要設置了proxyHost和proxyPort就不用寫proxySet了。
那麼反過來,顯示這些系統屬性,就可以看到有沒有使用代理了。
如何用JAVA實現一個代理伺服器
代理伺服器的應用非常廣泛。比如,在企業網內部,它可以用來控制員工在工作時瀏覽的Internet內容,阻止員工訪問某些類型的內容或某些指定的網站。代理伺服器實際上扮演著瀏覽器和Web伺服器之間的中間人的角色,能夠對瀏覽器請求進行各種各樣的處理,能夠過濾廣告和Cookie,能夠預先提取Web頁面,使得瀏覽器訪問頁面的速度更快,等等。
一、基礎知識
不管以哪種方式應用代理伺服器,其監控HTTP傳輸的過程總是如下:
步驟一:內部的瀏覽器發送請求給代理伺服器。請求的第一行包含了目標URL。
步驟二:代理伺服器讀取該URL,並把請求轉發給合適的目標伺服器。
步驟三:代理伺服器接收來自Internet目標機器的應答,把應答轉發給合適的內部瀏覽器。
例如,假設有一個企業的僱員試圖訪問網站。如果沒有代理伺服器,僱員的瀏覽器打開的Socket通向運行這個網站的Web伺服器,從Web伺服器返回的數據也直接傳遞給僱員的瀏覽器。如果瀏覽器被配置成使用代理伺服器,則請求首先到達代理伺服器;隨後,代理伺服器從請求的第一行提取目標URL,打開一個通向的Socket。當返回應答時,代理伺服器把應答轉發給僱員的瀏覽器。
當然,代理伺服器並非只適用於企業環境。作為一個開發者,擁有一個自己的代理伺服器是一件很不錯的事情。例如,我們可以用代理伺服器來分析瀏覽器和Web伺服器的交互過程。測試和解決Web應用中存在的問題時,這種功能是很有用的。我們甚至還可以同時使用多個代理伺服器(大多數代理伺服器允許多個伺服器鏈接在一起使用)。例如,我們可以有一個企業的代理伺服器,再加上一個用java編寫的代理伺服器,用來調試應用程序。但應該注意的是,代理伺服器鏈上的每一個伺服器都會對性能產生一定的影響。
二、設計規劃
正如其名字所示,代理伺服器只不過是一種特殊的伺服器。和大多數伺服器一樣,如果要處理多個請求,代理伺服器應該使用線程。下面是一個代理伺服器的基本規劃:
等待來自客戶(Web瀏覽器)的請求。
啟動一個新的線程,以處理客戶連接請求。
讀取瀏覽器請求的第一行(該行內容包含了請求的目標URL)。
分析請求的第一行內容,得到目標伺服器的名字和埠。
打開一個通向目標伺服器(或下一個代理伺服器,如合適的話)的Socket。
把請求的第一行發送到輸出Socket。
把請求的剩餘部分發送到輸出Socket。
把目標Web伺服器返回的數據發送給發出請求的瀏覽器。
當然,如果考慮細節的話,情況會更複雜一些。實際上,這裡主要有兩個問題要考慮:第一,從Socket按行讀取數據最適合進一步處理,但這會產生性能瓶頸;第二,兩個Socket之間的連接必需高效。有幾種方法可以實現這兩個目標,但每一種方法都有各自的代價。例如,如果要在數據進入的時候進行過濾,這些數據最好按行讀取;然而,大多數時候,當數據到達代理伺服器時,立即把它轉發出去更適合高效這一要求。另外,數據的發送和接收也可以使用多個獨立的線程,但大量地創建和拆除線程也會帶來性能問題。因此,對於每一個請求,我們將用一個線程處理數據的接收和發送,同時在數據到達代理伺服器時,儘可能快速地把它轉發出去。
三、實例
在用java編寫這個代理伺服器的過程中,注意可重用性是很重要的。因為這樣的話,當我們想要在另一個工程中以不同的方式處理瀏覽器請求時,可以方便地重用該代理伺服器。當然,我們必須注意靈活性和效率之間的平衡。
圖一顯示了本文代理伺服器實例(HttpProxy.java)的輸出界面,當瀏覽器訪問時,代理伺服器向默認日誌設備(即標準輸出設備屏幕)輸出瀏覽器請求的URL。圖二顯示了SubHttpProxy的輸出。SubHttpProxy是HttpProxy的一個簡單擴展。
圖一
圖二
為了構造代理伺服器,我從Thread基類派生出了HttpProxy類(文章正文中出現的代碼是該類的一些片斷,完整的代碼請從本文最後下載)。HttpProxy類包含了一些用來定製代理伺服器行為的屬性,參見Listing 1和表一。
【Listing 1】
/*************************************
* 一個基礎的代理伺服器類
*************************************
*/
import java.net.*;
import java.io.*;
public class HttpProxy extends Thread {
static public int CONNECT_RETRIES=5;
static public int CONNECT_PAUSE=5;
static public int TIME-OUT=50;
static public int BUFSIZ=1024;
static public boolean logging = false;
static public OutputStream log=null;
// 傳入數據用的Socket
protected Socket socket;
// 上級代理伺服器,可選
static private String parent=null;
static private int parentPort=-1;
static public void setParentProxy(String name, int pport) {
parent=name;
parentPort=pport;
}
// 在給定Socket上創建一個代理線程。
public HttpProxy(Socket s) { socket=s; start(); }
public void writeLog(int c, boolean browser) throws IOException {
log.write(c);
}
public void writeLog(byte[] bytes,int offset,
int len, boolean browser) throws IOException {
for (int i=0;ilen;i++) writeLog((int)bytes[offset+i],browser);
}
// 默認情況下,日誌信息輸出到
// 標準輸出設備,
// 派生類可以覆蓋它
public String processHostName(String url, String host, int port, Socket sock) {
java.text.DateFormat cal=java.text.DateFormat.getDateTimeInstance();
System.out.println(cal.format(new java.util.Date()) + ” – ” +
url + ” ” + sock.getInetAddress()+”BR”);
return host;
}
表一
變數/方法 說明
CONNECT_RETRIES 在放棄之前嘗試連接遠程主機的次數。
CONNECT_PAUSE 在兩次連接嘗試之間的暫停時間。
TIME-OUT 等待Socket輸入的等待時間。
BUFSIZ Socket輸入的緩衝大小。
logging 是否要求代理伺服器在日誌中記錄所有已傳輸的數據(true表示「是」)。
log 一個OutputStream對象,默認日誌常式將向該OutputStream對象輸出日誌信息。
setParentProxy 用來把一個代理伺服器鏈接到另一個代理伺服器(需要指定另一個伺服器的名稱和埠)。
當代理伺服器連接到Web伺服器之後,我用一個簡單的循環在兩個Socket之間傳遞數據。這裡可能出現一個問題,即如果沒有可操作的數據,調用read方法可能導致程序阻塞,從而掛起程序。為防止出現這個問題,我用setSoTimeout方法設置了Socket的超時時間(參見Listing 2)。這樣,如果某個Socket不可用,另一個仍舊有機會進行處理,我不必創建一個新的線程。
【Listing 2】
// 執行操作的線程
public void run() {
String line;
String host;
int port=80;
Socket outbound=null;
try {
socket.setSoTimeout(TIMEOUT);
InputStream is=socket.getInputStream();
OutputStream os=null;
try {
// 獲取請求行的內容
line=””;
host=””;
int state=0;
boolean space;
while (true) {
int c=is.read();
if (c==-1) break;
if (logging) writeLog(c,true);
space=Character.isWhitespace((char)c);
switch (state) {
case 0:
if (space) continue;
state=1;
case 1:
if (space) {
state=2;
continue;
}
line=line+(char)c;
break;
case 2:
if (space) continue; // 跳過多個空白字元
state=3;
case 3:
if (space) {
state=4;
// 只分析主機名稱部分
String host0=host;
int n;
n=host.indexOf(“//”);
if (n!=-1) host=host.substring(n+2);
n=host.indexOf(‘/’);
if (n!=-1) host=host.substring(0,n);
// 分析可能存在的埠號
n=host.indexOf(“:”);
if (n!=-1) {
port=Integer.parseInt(host.substring(n+1));
host=host.substring(0,n);
}
host=processHostName(host0,host,port,socket);
if (parent!=null) {
host=parent;
port=parentPort;
}
int retry=CONNECT_RETRIES;
while (retry–!=0) {
try {
outbound=new Socket(host,port);
break;
} catch (Exception e) { }
// 等待
Thread.sleep(CONNECT_PAUSE);
}
if (outbound==null) break;
outbound.setSoTimeout(TIMEOUT);
os=outbound.getOutputStream();
os.write(line.getBytes());
os.write(‘ ‘);
os.write(host0.getBytes());
os.write(‘ ‘);
pipe(is,outbound.getInputStream(),os,socket.getOutputStream());
break;
}
host=host+(char)c;
break;
}
}
}
catch (IOException e) { }
} catch (Exception e) { }
finally {
try { socket.close();} catch (Exception e1) {}
try { outbound.close();} catch (Exception e2) {}
}
}
和所有線程對象一樣,HttpProxy類的主要工作在run方法內完成(見Listing 2)。run方法實現了一個簡單的狀態機,從Web瀏覽器每次一個讀取字元,持續這個過程直至有足夠的信息找出目標Web伺服器。然後,run打開一個通向該Web伺服器的Socket(如果有多個代理伺服器被鏈接在一起,則run方法打開一個通向鏈裡面下一個代理伺服器的Socket)。打開Socket之後,run先把部分的請求寫入Socket,然後調用pipe方法。pipe方法直接在兩個Socket之間以最快的速度執行讀寫操作。
如果數據規模很大,另外創建一個線程可能具有更高的效率;然而,當數據規模較小時,創建新線程所需要的開銷會抵消它帶來的好處。
Listing 3顯示了一個很簡單的main方法,可以用來測試HttpProxy類。大部分的工作由一個靜態的startProxy方法完成(見Listing 4)。這個方法用到了一種特殊的技術,允許一個靜態成員創建HttpProxy類(或HttpProxy類的子類)的實例。它的基本思想是:把一個Class對象傳遞給startProxy類;然後,startProxy方法利用映像API(Reflection API)和getDeclaredConstructor方法確定該Class對象的哪一個構造函數接受一個Socket參數;最後,startProxy方法調用newInstance方法創建該Class對象。
【Listing 3】
// 測試用的簡單main方法
static public void main(String args[]) {
System.out.println(“在埠808啟動代理伺服器\n”);
HttpProxy.log=System.out;
HttpProxy.logging=false;
HttpProxy.startProxy(808,HttpProxy.class);
}
}
【Listing 4】
static public void startProxy(int port,Class clobj) {
ServerSocket ssock;
Socket sock;
try {
ssock=new ServerSocket(port);
while (true) {
Class [] sarg = new Class[1];
Object [] arg= new Object[1];
sarg[0]=Socket.class;
try {
java.lang.reflect.Constructor cons = clobj.getDeclaredConstructor(sarg);
arg[0]=ssock.accept();
cons.newInstance(arg); // 創建HttpProxy或其派生類的實例
} catch (Exception e) {
Socket esock = (Socket)arg[0];
try { esock.close(); } catch (Exception ec) {}
}
}
} catch (IOException e) {
}
}
利用這種技術,我們可以在不創建startProxy方法定製版本的情況下,擴展HttpProxy類。要得到給定類的Class對象,只需在正常的名字後面加上.class(如果有某個對象的一個實例,則代之以調用getClass方法)。由於我們把Class對象傳遞給了startProxy方法,所以創建HttpProxy的派生類時,就不必再特意去修改startProxy。(下載代碼中包含了一個派生得到的簡單代理伺服器)。
結束語
利用派生類定製或調整代理伺服器的行為有兩種途徑:修改主機的名字,或者捕獲所有通過代理伺服器的數據。processHostName方法允許代理伺服器分析和修改主機名字。如果啟用了日誌記錄,代理伺服器為每一個通過伺服器的字元調用writeLog方法。如何處理這些信息完全由我們自己決定——可以把它寫入日誌文件,可以把它輸出到控制台,或進行任何其他滿足我們要求的處理。writeLog輸出中的一個Boolean標記指示出數據是來自瀏覽器還是Web主機。
和許多工具一樣,代理伺服器本身並不存在好或者壞的問題,關鍵在於如何使用它們。代理伺服器可能被用於侵犯隱私,但也可以阻隔偷窺者和保護網路。即使代理伺服器和瀏覽器不在同一台機器上,我也樂意把代理伺服器看成是一種擴展瀏覽器功能的途徑。例如,在把數據發送給瀏覽器之前,可以用代理伺服器壓縮數據;未來的代理伺服器甚至還可能把頁面從一種語言翻譯成另一種語言……可能性永無止境。
Java 中怎樣在程序中設置代理伺服器
從JDK1.5開始,Java在java.net包下提供了Proxy和ProxySelector兩個類,其中Proxy代表一個代理伺服器,可以在打開URLConnection連接時指定所用的Proxy實例,也可以在創建Socket連接時指定Proxy實例。而ProxySelector代表一個代理選擇器,它提供了對代理伺服器更加靈活的控制,它可以對HTTP、HTTPS、FTP、SOCKS等分別設置,而且還可以設置不需要通過代理伺服器的主機和地址。通過使用ProxySelector可以達到像在Internet Explorer、FireFox等軟體中設置代理伺服器類似的效果。
代理伺服器的功能就是代理網路用戶去取得網路信息。我們使用網路瀏覽器直接連接其他Internet站點取得網路信息時,通常需要發送Request請求來等到響應。代理伺服器是介於瀏覽器和Web伺服器之間的一台伺服器,有了它之後,瀏覽器不是直接到Web伺服器去取得網頁數據而是向代理伺服器發出請求,Request請求會先送到代理伺服器,由代理伺服器來取回瀏覽器所需要的信息並送回給網路瀏覽器。而且,大部分代理伺服器都具有緩衝的功能,就好像一個大的Cache,它有很大的存儲空間,它不斷將新取得的數據儲存到它本機的存儲器上,如果瀏覽器所請求的數據在它本機的存儲器上已經存在而且是最新的,那麼它就不重新從Web伺服器取數據,而直接將存儲器上的數據傳送給用戶的瀏覽器,這樣就能顯著提高瀏覽速度和效率。歸納起來代理伺服器主要提供如下兩個功能:
突破自身IP限制,對外隱藏自身IP地址。突破IP限制包括訪問國外受限站點,訪問國內特定單位、團體的內部資源。
提高訪問速度,代理伺服器提供的緩衝功能可以避免每個用戶都直接訪問遠程主機,從而提高客戶端訪問速度。
17.5.1 直接使用Proxy創建連接
Proxy有如下一個構造器:Proxy(Proxy.Type type, SocketAddress sa):創建表示代理伺服器的Proxy對象。而sa參數指定代理伺服器的地址,其中type是該代理伺服器的類型,該伺服器類型有如下三種:
(1)Proxy.Type.DIRECT:表示直接連接或缺少代理。
(2)Proxy.Type.HTTP:表示高級協議的代理,如 HTTP 或 FTP。
(3)Proxy.Type.SOCKS:表示 SOCKS(V4 或 V5)代理。
一旦創建了Proxy對象之後,程序就可以在使用URLConnection打開連接時,或創建Socket連接時傳入一個Proxy對象,作為本次連接所使用的代理伺服器。
其中URL包含了一個URLConnection openConnection(Proxy proxy)方法,該方法使用指定的代理伺服器來打開連接;而Socket則提供了一個Socket(Proxy proxy)構造器,該構造器使用指定的代理伺服器創建一個沒有連接的Socket對象。
下面以URLConnection為例來介紹如何在URLConnection中使用代理伺服器。
程序清單:codes/17/17-5/ProxyTest.java
上面代碼第一行粗體字代碼創建了一個Proxy對象,第二行粗體字代碼就是用Proxy對象來打開URLConnection連接。除此之外,該程序的其他地方就是對URLConnection的使用了。由此可見, JDK1.5提供了對代理伺服器很好的支持。
17.5.2 使用ProxySelector選擇代理伺服器
前面介紹的直接使用Proxy對象可以在打開URLConnection或Socket時指定代理伺服器,使用這種方式需要每次打開連接都顯式設置代理伺服器。如果想讓系統打開連接時總是具有默認的代理伺服器,則可以使用java.net.ProxySelector,它可以它根據不同的連接使用不同的代理伺服器。
系統默認的ProxySelector會檢測各種系統屬性和URL協議,然後決定怎樣連接不同的主機。當然,程序也可以調用ProxySelector類的setDefaultI()靜態方法來設置默認代理伺服器,也可以調用getDefault()方法獲得系統當前默認的代理伺服器。
程序可以通過System類來設置系統的代理伺服器屬性,關於代理伺服器常用的屬性名有如下三個:
http.proxyHost:設置HTTP訪問所使用的代理伺服器地址。該屬性名的前綴可以改為https、ftp等,分別用於設置HTTP訪問、安全HTTP訪問和FTP訪問所用的代理伺服器地址。
http.proxyPort:設置HTTP訪問所使用的代理伺服器埠。該屬性名的前綴可以改為https、ftp等,分別用於設置HTTP訪問、安全HTTP訪問和FTP訪問所用的代理伺服器埠。
http.nonProxyHosts:設置HTTP訪問中不需要使用代理伺服器的遠程主機,可以使用*通配符,如果有多個地址,多個地址用豎線(|)分隔。
下面程序示範了通過改變系統屬性來改變默認的代理伺服器。
程序清單:codes/17/17-5/ ProxySelectorTest.java
上面程序中三行粗體字代碼設置Java打開HTTP訪問時的代理伺服器屬性,其中前兩行代碼設置代理伺服器的地址和埠,第三行代碼設置該代理HTTP訪問哪些主機時不需要使用代理伺服器。上面程序的①行代碼處直接打開一個URLConnection,但系統會為打開該URLConnection時使用代理伺服器。
運行上面程序,將會看到程序長時間等待,因為192.168.0.96通常並不是有效的代理伺服器(當然,如果讀者運行的機器恰好可以使用地址為192.168.0.96的代理伺服器又另當別論)。
系統提供了默認的ProxySelector子類作為代理選擇器,開發者可以實現自己的代理選擇器,程序可以通過繼承ProxySelector來實現自己的代理選擇器。繼承ProxySelector需要重寫兩個方法:
ListProxy select(URI uri):實現該方法讓代理選擇器根據不同的URI來使用不同的代理伺服器,該方法就是代理選擇器管理網路連接使用代理伺服器的關鍵。
connectFailed(URI uri, SocketAddress sa, IOException ioe):當系統通過默認的代理伺服器建立連接失敗後,代理選擇器將會自動調用該方法。通過重寫該方法可以對連接代理伺服器失敗的情形進行處理。
系統默認的代理伺服器選擇器也重寫了connectFailed方法,它重寫該方法的處理策略是:當系統設置的代理伺服器失敗時,默認代理選擇器將會採用直連的方式連接遠程資源,所以當運行上面程序等待了足夠長時間時,程序依然可以列印出該遠程資源的所有內容。
java使用代理訪問網路的幾種方法
使用Proxy來對每個連接實現代理, 這種方法只能在jdk 1.5以上的版本使用(包含jdk1.5), 優點是可以單獨的設置每個連接的代理, 缺點是設置比較麻煩:
public static void main(String[] args) {
try {
URL url = new URL(“”);
// 創建代理伺服器
InetSocketAddress addr = new InetSocketAddress(“192.168.0.254”,
8080);
// Proxy proxy = new Proxy(Proxy.Type.SOCKS, addr); // Socket 代理
Proxy proxy = new Proxy(Proxy.Type.HTTP, addr); // http 代理
// 如果我們知道代理server的名字, 可以直接使用
// 結束
URLConnection conn = url.openConnection(proxy);
InputStream in = conn.getInputStream();
// InputStream in = url.openStream();
String s = IOUtils.toString(in);
System.out.println(s);
} catch (Exception e) {
e.printStackTrace();
}
}
不是很詳細, 有什麼問題還望大家指正
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/190706.html