Google 페이지 계급 산법의 청정실 실시
Angsuman Chakraborty
2006년 8월 제 17
페이지 계급에 그들의 수많은 논평에서 반전 설계되는 자바에 있는 Google의 페이지 계급 산법의 마지막으로 청정실 실시 (또는 비둘기 계급? 이다).
공중 공전 int getPageRank (URL) {
//는 무작위 낮은 PR로 시작한다
int pageRank = rand.getInt (0, 3);
만약에 (isHostedOn ("google.com", URL)) {
pageRank++;
} 만약에 그밖에 (isHostedOn ("microsoft.com", URL)) {
pageRank--;
}
// 지원 유효한 페이지
만약에 (isValidPage (URL)) {
pageRank += 1;
}
tag_value ["b"] = 1;
tag_value ["h2"] = 2;
tag_value ["h1"] = 3;
tag_value [] = -1 "강한"; // W3C sux!
pageRank = calculateTagsPR (tag_value, pagerank);
희소식 위치가 다는 것을 // Sergey는 밝혔다
보금자리가 된 테이블의 // 제비
tablesOnPage = getTagCount ("테이블 ");
만약에 (tablesOnPage >= 50) {
pageRank += 2;
}
만약에 (pageRank >= 5) {
pageRank = 4; //는 AdWords를 판매하는 돕는다
}
만약에 (linksFrom ("mattcutts.com", URL) >= 4) {
// I 연결은에 위치만 "청소한다"
//? 매트, 2006년 2월
pagerank += 2;
}
pagerank += countBacklinks (URL)/10000;
blacklist1 = getList ("c:\chinese - 정부 censored.txt ");
blacklist2 = getList ("c:\larry - 페이지 hatelist.txt ");
만약에 (inArray (blacklist1, URL) || inArray (blacklist2, URL)) {
pageRank = 0;
}
d = dashesInUrl (URL);
pageRank = (d >= 3)? -1 pageRank: pageRank + 1;
만약에 (inString (URL, "폭탄"를 건축하는 방법)) {
//는 신청하는 대로 곧 추가했다. 2004-12-01.
수령인 = "peter@homelandsecurity.gov";
주제 = "당신은…" 이것을 검사하고 싶을지도 모르다;
sendMailTo (수령인, 주제, URL);
// 페이지는 아직도 관련될 것이 지도 모르다
pageRank++;
}
만약에 (달 () == "6월" || 달 () == "10월") {
//는 사람들을 에 대해서 이야기한
// PR 갱신, 좋은 공표
pagerank - = randomNumber (1,3);
}
만약에 (checkIdenticalPageAndLinkColor) {
// spammer!! Googleaxe 그것!!
pagerank = 0;
}
만약에 (URL == "http://www.nytimes.com ") {
다만 시험하는 //, pls는 내일 제거한다
//? Frank, 2003년 6월
pagerank = 10;
}
//Don ' 10 이상 t 쇼 PR
만약에 (pagerank > 10) pagerank = 10;
반환 pagerank;
}
(자바와 추가된 정상화 등등에) 잭 Tang의 아이디어와 본래 부호 에서 변경하는.
, 주요 뉴스, 어떻게에, 유머 Google의 밑에 신청하는, 기술 주, 웹, 웹 서비스 |
|
RSS 2.0 |
Trackback 이 기사 |
이 기사를 이메일을 보내십시오
당신은 또한 읽고 싶을지도 모른다 |




































