web関連

【php】外部サイトURLからmetaタイトルを抜き取ろうとしたときの備忘録

2020/05/12

プログラミング

php

外部サイトからmetaタイトルを取得しようと調べたら、思ったより方法が多かったので使い方の備忘録

URLから文字列に読み込むfile_get_contents関数

書き方としてはとてもシンプルで使い勝手はよかった
引数に何も指定しないと全部読み込もうとするけど、第五引数に読み込みの最大バイト数を指定できて多少読み込み速度とかに配慮をすることができる印象
※第四引数はどこから読み込みを始めるかのオフセット値

<?php
$url = "https://twotone.me/";
$html = file_get_contents($url,null,null,0,1024);
echo $html;
?>

Link：PHPのfile_get_contentsでファイル・URLの情報を取得する

Memo：参考

Link：【php】URLから外部サイトtitleを取得してリンクを生成するショートコード

Memo：書いた備忘録

file_get_contentsより読み込みが早いcURL関数

file_get_contentsより早くて、curl_setoptというオプションが色々用意されている
HTTPリクエスト(HTTPレスポンス)の情報を扱えるようになるみたい

バイト数制限とか調べたけど、見つからなかった

<?php
$url = "https://twotone.me/";
$ch = curl_init();//初期化
curl_setopt($ch, CURLOPT_URL, $url);//URLの指定
curl_setopt($ch, CURLOPT_HEADER, false);//ヘッダーの有無
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);//データを文字列に変換
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);//SSL証明書の検証
curl_setopt($ch, CURLOPT_TIMEOUT, 30);//タイムアウトする時間
$html = curl_exec($ch);//処理実行
curl_close($ch);//処理終了
echo $html;
?>

Link：PHPのfile_get_contentsをcURLへ置き換える

Memo：file_get_contentsとcURLの違いとか注意事項について書かれてた

Link：【php】cURLを使って外部サイトtitleを取得してリンクを生成するショートコード

Memo：書いた備忘録

一行づつ読み込むfgets関数

ファイルを1行づつwhile文で読み込む方法
他と違ってファイルへのアクセス方法(r=読み込み、w=書き出し)だとか指定する必要がある

<?php
$url = "https://twotone.me/";
// ファイルを開く
$file = fopen($url, "r");
// URLが読み込み可能ならファイルを一行づつ読み込み
if($file){
  while ($line = fgets($file)) {
  	echo $line;
  }
}
// ファイルを閉じる
fclose($file);
?>

Link：【PHP関数】fgetsによるファイル操作

Memo：まとめてあってわかりやすかった

Link：【PHP】fgets()を使って外部サイトのmetaタイトルを取得する

Memo：metaタイトルを取得するときにこれだったら、metaタイトルが見つかった時点で処理を中断かけられるから少しは早いのかなって思った

fgets関数触ってて思ったんだけど、開くファイルのソースコードが圧縮されてたりすると1行が凄い長くなって読み込むサイトによってはcURLのほうが早いんじゃないかな？って思うこともあった