Ga naar inhoud

HTML parsing in .NET


anoniem

Aanbevolen berichten

Ik ben het niet met je eens, er is op internet zat informatie te vinden over het programmeren in .NET... Heb je op google al gezocht naar [url=http://www.google.nl/search?source=ig&hl=nl&rlz=1G1GGLQ_NLNL256&q=vb+.net+html+parsing&btnG=Google+zoeken&meta=&aq=f]vb .net html parsing[/url]? Dan vind je een aantal interessante links: - [url=http://www.codeguru.com/vb/vb_internet/html/article.php/c4815/]CodeGuru: Parsing HTML without Using the Browser Control[/url] - [url=http://www.netomatix.com/Products/DocumentManagement/HTMLParserNet.aspx]HTML Parser For .NET C#, VB.Net[/url] [url=http://www.codeproject.com]CodeProject[/url] is ook een goeie site voor programmeervoorbeelden, zo vind je daar: - [url=http://www.codeproject.com/KB/vb/Parsing_HTML.aspx]HTML Parsing using .NET Framework[/url] - [url=http://www.codeproject.com/KB/vb/webresourceprovidernet.aspx]WebResourceProvider VB.NET style[/url] Genoeg te vinden dus... :wink:
Link naar reactie
Het is allemaal net niet wat ik zoek. Waar ik naar opzoek ben is een manier van HTML Parsing waarbij ik bepaalde informatie van een webpagina kan plukken en kan plakken in een label. Het idee is om een RuneScape Client te maken, waarbij de speler door het intypen van zijn naam, zijn statistieken kan bekijken. Deze statistieken moeten vanuit deze pagina geparsed worden: http://hiscore.runescape.com/index_lite.ws?player=YourName voorbeeld: http://hiscore.runescape.com/index_lite.ws?player=Foxdoll De HTML Parser moet dit omzetten. Dus van iedere 3 delen, gescheiden met een komma een geheel maken. Dus Level, Experience en Rank. En deze weergeven in een label.
Link naar reactie
Voor zo'n simpele pagina is het eenvoudiger: 1. Vraag de webpagina op in je VB .NET programma, voor een voorbeeld, zie [url=http://www.dreamincode.net/forums/index.php?showtopic=39206&st=0&p=287734&#entry287734]hier[/url]. Als je dat voorbeeld gebruikt, dan zal je dus zelf iets toevoegen in de trant van: [code:1:ca73a9398b]Dim page As String = GetPage("http://hiscore.runescape.com/index_lite.ws?player=Foxdoll") Dim body As String = ExtractBody(page)[/code:1:ca73a9398b] 2. Nu je de 'body' van de pagina in een string hebt, wat dus bestaat uit een lijst van telkens 3 cijfers, gescheiden door een komma, kan je met de string split functie de individuele waarden krijgen. Om eerst elke regel als aparte string in een array te krijgen, gebruik je: [code:1:ca73a9398b]Dim lines As String() = body.Split(Nothing)[/code:1:ca73a9398b] 3. Om vervolgens in elke regel de kommagescheiden waarden te krijgen, kan je het volgende gebruiken: [code:1:ca73a9398b]For Each line As String In lines Dim values As String() = line.Split(',') ' Doe wat met je values Next line[/code:1:ca73a9398b] Dit zijn slechts codevoorbeelden, je moet ze uiteraard nog aanpassen naar jouw situatie.
Link naar reactie

Om een reactie te plaatsen, moet je eerst inloggen

Gast
Reageer op dit topic

×   Geplakt als verrijkte tekst.   Herstel opmaak

  Er zijn maximaal 75 emoji toegestaan.

×   Je link werd automatisch ingevoegd.   Tonen als normale link

×   Je vorige inhoud werd hersteld.   Leeg de tekstverwerker

×   Je kunt afbeeldingen niet direct plakken. Upload of voeg afbeeldingen vanaf een URL in

  • Populaire leden

    Er is nog niemand die deze week reputatie heeft ontvangen.

  • Leden

    Geen leden om te tonen

×
×
  • Nieuwe aanmaken...