Karakter seti problemi
Merhaba
Birden fazla siteden veri çekerken karakter seti problemi yaşıyorum. Tayfun Erbilenin http://www.erbilen.net/php-ile-bir-dosyanin-karakter-kodlamasini-ogrenmek/ buradaki çözümü bazı sitelerde çalışmıyor. Örneğin aksam.com.tr de denerseniz bu koddan UTF-8 dönüyor ancak karakter seti ISO-8859-9 .Dolayısıyla çekilen veriden karakter dönüşümü yapamadığım için problemli karakterler görünüyor.
Birden fazla site olduğu için karakter setlerini otomatik öğrenip convert etmem gerekiyor.
Bu problemi nasıl çözerbilirim ?
Denemedim kodunu çünkü her siteden alamazsın böyle desenle. Şöyle bir şeyler yazmalısın.
<?php
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://www.aksam.com.tr/guncel/ozel-araclarda-maske-zorunlulugu/haber-1062920");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$output = curl_exec($ch);
curl_close($ch);
//$output = iconv('ISO-8859-9', 'utf-8', $output);
preg_match("~<head>(.*?)</head>~s", $output, $header_match);
preg_match_all("~charset="?([^"]+)"?~", $header_match[1], $matches);
echo "<pre>";
print_r($matches);
echo "</pre>";