Inicia sesión


Comprobar en PHP si existe un archivo o una URL

Comprobar en PHP si existe un archivo o una URLUna tarea muy habitual en PHP es comprobar si un archivo o una URL existe. En este tutorial vamos a ver como hacerlo, diferentes alternativas y sus peculiaridades para que puedas elegir la mejor en cada caso.

Comprobar un archivo: is_file y file_exists


is_file y file_exists son dos funciones nativas de PHP que se pueden utilizar para verificar si un determinado archivo existe o no. Aunque sus nombre son bastante descriptivos, hay que saber que:

  • is_file devuelve true sólo si la ruta pasada a la función es efectivamente un archivo existente.
  • file_exists devuelve true tanto si la ruta pasada es un archivo como un directorio válido (utiliza is_dir si quieres comprobar específicamente si una ruta es un directorio pero no un archivo).
Esta diferencia es muy importante. Si tu objetivo son únicamente archivos y no directorios is_file es tu función. Si quieres comprobar un directorio o un archivo indiferentemente elige file_exists.
$file ='/home/misitio/public_html/directorio/archivo.php';
$directory ='/home/misitio/public_html/directorio/';

// Devuelve true
$exists = is_file( $file );
// Devuelve false
$exists = is_file( $directory );

// Devuelve true
$exists = file_exists( $file );
// Devuelve TRUE
$exists = file_exists( $directory );

Comprobar una URL: get_headers, file_get_contents y cURL


Para comprobar la existencia de una URL únicamente necesitamos tener acceso a las cabeceras de respuesta del servidor al que se le solicita la URL y comprobar que el código de respuesta sea del tipo 2xx (OK) o 3xx (reidrecciones, opcional); nunca un código 4xx o 5xx que son códigos de error. Para obtener las cabeceras basta con hacer una solicitud HTTP con el método HEAD, mucho más ligero que el método GET o el método POST.

La función file_get_contents admite una URL y es muy frecuentemente mencionada como método para comprobar si una URL existe o no. Sinceramente, creo que esta función sobrepasa lo necesario y es poco eficiente para este fin. No obstante, como es muy utilizada, os dejo un ejemplo «eficiente» del uso de file_get_contents para comprobar una URL; fíjate en que la solicitud HTTP se realiza mediante el método HEAD:
$url = "https://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {
 
    if( empty( $url ) ){
        return false;
    }
 
    $options['http'] = array(
        'method' => "HEAD",
        'ignore_errors' => 1,
        'max_redirects' => 0
    );
    $body = @file_get_contents( $url, NULL, stream_context_create( $options ) );
    
    // Ver...php.net/manual/es/reserved.variables.httpresponseheader.php
    if( isset( $http_response_header ) ) {
        sscanf( $http_response_header[0], 'HTTP/%*d.%*d %d', $httpcode );
 
        // Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
        $accepted_response = array( 200, 301, 302 );
        if( in_array( $httpcode, $accepted_response ) ) {
            return true;
        } else {
            return false;
        }
     } else {
         return false;
     }
}
Otra forma sería utilizando get_headers:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {

    if( empty( $url ) ){
        return false;
    }

    // get_headers() realiza una petición GET por defecto,
    // cambiar el método predeterminadao a HEAD
    // Ver ...php.net/manual/es/function.get-headers.php
    stream_context_set_default(
        array(
            'http' => array(
                'method' => 'HEAD'
             )
        )
    );
    $headers = @get_headers( $url );
    sscanf( $headers[0], 'HTTP/%*d.%*d %d', $httpcode );

    // Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( in_array( $httpcode, $accepted_response ) ) {
        return true;
    } else {
        return false;
    }
}
Y por último el método idóneo desde mi punto de vista utilizando la biblioteca cURL (incluida en PHP desde 4.0.2). El código es un poco más largo pero permite controlar de forma granular las opciones de conexión y solicitud de la URL:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {

    if( empty( $url ) ){
        return false;
    }

    $ch = curl_init( $url );
 
    // Establecer un tiempo de espera
    curl_setopt( $ch, CURLOPT_TIMEOUT, 5 );
    curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, 5 );

    // Establecer NOBODY en true para hacer una solicitud tipo HEAD
    curl_setopt( $ch, CURLOPT_NOBODY, true );
    // Permitir seguir redireccionamientos
    curl_setopt( $ch, CURLOPT_FOLLOWLOCATION, true );
    // Recibir la respuesta como string, no output
    curl_setopt( $ch, CURLOPT_RETURNTRANSFER, true );

    // Descomentar si tu servidor requiere un user-agent, referrer u otra configuración específica
    // $agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36';
    // curl_setopt($ch, CURLOPT_USERAGENT, $agent)

    $data = curl_exec( $ch );

    // Obtener el código de respuesta
    $httpcode = curl_getinfo( $ch, CURLINFO_HTTP_CODE );
    //cerrar conexión
    curl_close( $ch );

    // Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( in_array( $httpcode, $accepted_response ) ) {
        return true;
    } else {
        return false;
    }

}
Y si estás en WordPress, deberías utilizar la función wp_remote_head:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ){

    if( empty( $url ) ){
        return false;
    }

    $response = wp_remote_head( $url, array( 'timeout' => 5 ) );

    // Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( ! is_wp_error( $response ) && in_array( wp_remote_retrieve_response_code( $response ), $accepted_response ) ) { 
        return true;
    } else {
         return false;
    }

}
¿Algún método más o que consideres mejor?


  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-08-11
  • Categorias: WordPress Lenguajes De Programacion php WebSite webmasters Noticias Tutorial




Información
Usuarios que no esten registrados no pueden dejar comentarios, te invitamos a que te registre!






Historia de los sistemas operativos

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-11-12
  • Categorias: Microsoft Windows Apple Ordenador Noticias Tutorial Informatica

Vacía tu mente, no tengas forma, ni figura

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-11-12
  • Categorias: Estilo Noticias Tutorial

Justificante de pago de Google Adsense

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-11-12
  • Categorias: Google Adsense WebSite Marketing Noticias Tutorial

Curso de iniciación de JavaScript

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-10-21
  • Categorias: Lenguajes De Programacion javascript Cursos Noticias Tutorial

Cómo insertar código JavaScript

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-10-21
  • Categorias: Lenguajes De Programacion javascript Cursos Noticias Tutorial

Expresiones JavaScript para especificar valores de atributos en HTML

  • Autor:
  • Editor: Tutoriales En Linea
  • Fecha:2019-10-21
  • Categorias: Lenguajes De Programacion javascript Cursos Noticias Tutorial