Znaki zapytania w pobranym kodzie strony.

0

Siema.

Robię aplikację, która pobiera komentarze wraz z autorami z YouTube w C# i .NET. Problem polega na tym, że po pobraniu kodu w komentarzach występują znaki zapytania ("?"). Przykład:

<div class="comment-text" dir="ltr">
          <p>Seba nawet? jak nagrasz jeszcze 100 razy Peru to i tak z wielka przyjemnoscia to obejrzę! Pozdrawiam</p>

        </div>

Powinno być oczywiście:

<div class="comment-text" dir="ltr">
          <p>Seba nawet jak nagrasz jeszcze 100 razy Peru to i tak z wielka przyjemnoscia to obejrzę! Pozdrawiam</p>

        </div>

Ustawiam kodowanie UTF8. Zresztą, najlepiej dam kod:

public class WebHelper : WebClient
{
...
 
	public string DownloadData(string url)
	{
		string sourceCode;
	 
		webClient.Headers.Add("Content-Type", "application/x-www-form-urlencoded");
		webClient.Headers.Add("User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1");
	 
		byte[] responseBuffer = null;
		while (true)
		{
			try
			{
				responseBuffer = webClient.DownloadData(url);
			}
			catch (WebException ex)
			{
				Thread.Sleep(5000);
				continue;
			}
			catch(NotSupportedException ex)
			{
				continue;
			}
	 
			sourceCode = Encoding.UTF8.GetString(responseBuffer, 0, responseBuffer.Length);
	 
			break;
		}
	 
		return sourceCode;
	}
}

Skąd te znaki zapytania?!
Liczę na Waszą pomoc :).

0

Dodam, że te losowe znaki zapytania nie występują nigdzie poza <div class="comment-text" dir="ltr"> oraz </div>

0

Dobra, udało mi się naprawić.

0
omnomnomnom napisał(a):

Dobra, udało mi się naprawić.

NIE podawaj rozwiązania bo może ktoś tutaj trafi z podobnym problemem więc zrób tak żeby się NIE dowiedział co jest przyczyną ani jakie jest rozwiązanie.
Osobiście obstawiam że '?' to wynik niepoprawnego znaku UTF8.

1 użytkowników online, w tym zalogowanych: 0, gości: 1