Discussion:
Linkchecker i Python
(for gammel til at besvare)
Bertel Lund Hansen
2016-05-21 07:48:31 UTC
Permalink
Jeg kunne tænke mig at skrive en linkchecker i Python, men det
spørgsmål jeg har (i øjeblikket) angår mere HTTP-protokollen, så
derfor spørger jeg her.

Jeg har fundet ud af at lave en connection til en webside, og jeg
kan også få status skrevet ud, men hvis den så siger "Moved
permanently", hvordan får jeg så fat i den direkte url - den er
redirectet til?
--
Bertel - stadig med Linux
Anders Wegge Keller
2016-05-23 19:24:30 UTC
Permalink
On Sat, 21 May 2016 09:48:31 +0200
Post by Bertel Lund Hansen
Jeg kunne tænke mig at skrive en linkchecker i Python, men det
spørgsmål jeg har (i øjeblikket) angår mere HTTP-protokollen, så
derfor spørger jeg her.
Jeg har fundet ud af at lave en connection til en webside, og jeg
kan også få status skrevet ud, men hvis den så siger "Moved
permanently", hvordan får jeg så fat i den direkte url - den er
redirectet til?
Det afhænger af hvordan du åbner linket. Bruger du urllib, requests, eller
åbner du selv din socket?
--
//Wegge
Bertel Lund Hansen
2016-05-23 20:44:29 UTC
Permalink
Post by Anders Wegge Keller
Post by Bertel Lund Hansen
Jeg har fundet ud af at lave en connection til en webside, og jeg
kan også få status skrevet ud, men hvis den så siger "Moved
permanently", hvordan får jeg så fat i den direkte url - den er
redirectet til?
Det afhænger af hvordan du åbner linket. Bruger du urllib,
requests, eller åbner du selv din socket?
Jeg bruger urllib.
--
Bertel - stadig med Linux
Anders Wegge Keller
2016-05-24 14:45:14 UTC
Permalink
On Mon, 23 May 2016 22:44:29 +0200
Post by Bertel Lund Hansen
Post by Anders Wegge Keller
Post by Bertel Lund Hansen
Jeg har fundet ud af at lave en connection til en webside, og jeg
kan også få status skrevet ud, men hvis den så siger "Moved
permanently", hvordan får jeg så fat i den direkte url - den er
redirectet til?
Det afhænger af hvordan du åbner linket. Bruger du urllib,
requests, eller åbner du selv din socket?
Jeg bruger urllib.
Du burde nok overveje at bruge requests i stedet, medmindre du har behov
for at kunne styre SSL og HTTP Auth meget præcist. Men that aside, så tag et
kig på

<https://docs.python.org/3/library/urllib.request.html#module-urllib.response>

Det objekt urlopen returnerer, har en geturl metode, der fortæller hvad du
er redirected til.
--
//Wegge
Loading...