Saltar al contenido

TeamPlatino

octubre 9, 2021
teamplatino
Resumen de las clases de teamplatino. Aquí estoy poniendo mis apuntes para recordarlo.

Contenido gratis gracias a las transcripciones o subtítulos de Youtube

Filtrar videos en youtube por:

  • esta semana
  • subtitulos
  • duración

El plugin YouContent funciona con el plugin clasic editor modo html.

Recursos:

Uso del Plugin YouContent

Primeramente subir el plugin youcontent y también el plugin clasic editor, sin esto no va funcionar.
Crear una nueva entrar y ponerlo en modo html
En la caja de youcontent pegar solamente el id del video, ósea el que viene después del watch.
https://www.youtube.com/watch?v=PEZqV_Qt8fk
Seleccionar el idioma español y Run

Verificar si hay plagio

Para hacer esto solamente copia una parte del contenido y pégalo en el buscador de Google con comillas.

Técnica para conseguir contenidos originales muy rápido

CHUHACKS #6 – ¡SpeechNotes Reloaded! Contenido gratis

Usar microfono puesto enfrente del altavoz y el https://speechnotes.co/es/ copiando todo.

Índice

WP Automatic

Creando web automáticas

Una desventaja de wp automatic es que tiende a falla cuando los artículos son muy largos, trata de usarlo con artículos cortos para su buen funcionamiento.

Webs automáticas desde WordPress paso a paso [2]

En esta clase os voy a enseñar cómo podemos scrapear las URLs de un sitio para luego rasparlo con WP Automatic. Principalmente hay 3 formas:

1. Con Ahrefs y palabras clave orgánicas
2. Con Screaming Frog (licencia de Screaming Frog, usuario:TPRookie y licencia:25601892D7-1620938803-299431C4D3) o programas similares que cumplen la misma función, como Scrapebox, Xenu, etc.
3. A través del sitemap.xml

Adicionalmente hay más formas de scrapear, ya que como ya sabréis con el propio Webscraper, Visual Web Ripper o Content Grabber podemos ir paginando y extrayendo las URLs. Todas estas herramientas se han visto en el pasado.

– Link oficial del plugin
– El plugin podéis descargarlo aquí.
– Para limpiar las listas de URLs uso Cerveza.gratis
– Extensión Link Grabber

1 Primer método para sacar URLs

El primer método de scrapeo es meter un listado de artículos que mejor funcionan en una web de otro idioma.

Sitio web beginnersbook.com

AHREF

  1. Ingresar a ahref.com
  2. Poner la url de la web
  3. Ir luego a palabras orgánicas
  4. Exportar a CSV (UTF-8)

EXCEL

  • Abrir el archivo csv con Excel
  • menú Datos
  • Textos en columnas
  • Delimitación
  • Separación por tabulación y coma.
  • Siguiente y finalizar
  • copiar toda la columna URL

LIMPIAR URL

Ir a cerveza.gratis 
Remove duplicate lines 
Limpiar el cuadro con «C» Clear all text
Marcar remove empty lines y clic en remove duplicate lines
control A para seleccionar y control c para copiar.

Eliminar paginaciones y url que no sirven:
Usar ‘Remove Lines Containing’ o
Usar ‘Delimited Column Extractor’ con el filtro de «#»

Sort Text Lines 
Lo que haremos será acomodar las url por longitun (lentgh) y eliminar las url que no sirven como la home.

2 Segundo método para sacar URL de un sitio.

En este método usamos de ejemplo la web de Hostinger que tiene paginaciones al final de cada articulo.

Screaming Frog

  • escribe la url https://www.hostinger.com y clic en empezar, hasta que terminar de analizar o stop.
  • Filtrar por html y exportar
  • Abrir en excel, separar por columnas luego copiar la columna de URLs.

Remove Lines Containing

  • pegar las url en el cuardro blanco, antes debe estar limpio.
  • agregar 2 OR, ejemplo: quiero dejar las url que tengan how-to/, tutorials/, blog/
  • entonces le decimos que nos remueva las lineas que no contengan las palabras que haz asignado arriba,
  • dando clic en «Not Containing».
  • copiamos la nueva lista de url.

Abrimos una nueva ventana de Remove Lines Containing

  • Lo que haremos ahora será remover palabras que contengan la lista de urls
  • ejemplo: remover palabras que contengan: page/, author/, -hostinger, assets
  • Clic en remove lines containing para remover.

Por ultimo usar la herramienta Sort Text Lines, ordenar con longitud y eliminar las url que no sirven o url que sean categorías.

3 Tercer metodo para sacar URLs.

Aquí aprenderemos a sacar urls mediante los sitemaps.

Blogs de ejemplos que tienen sitemap:

  • https://www.wpbeginner.com/blog
  • https://hostpapa.blog/
  • http://isitwp.com/blog
  • https://www.shivarweb.com/

Al dominio principal se agrega /sitemap.xml o /sitemap_index.xml

  1. Una vez abierto el sitemap del sitio web, da clic en el icono de la extensión link grabber.
  2. Y listo ya tienes la lista de url del sitio web.

Revisar la clase: Scrapear y traducir webs automáticas con método mucho mas simple.

Webs automáticas desde WordPress paso a paso [3]

En esta apartado aprenderás a crear una campaña con URLs especificas de sitios webs.

Recursos:

Crear una campaña desde cero y configuracion

Campaign Options

  • campaign type: multi-page scraper
  • ✅ Post from a list of posts URLs Instead (Fixed list)
  • Pegar el listado de url en «List of posts URLs (one post URL per line)»

Content Extraction Method

  • Strip parts after extracting content using REGEX (opcional), dentro del cuadro poner la regla que se eliminara o reemplazar. Ejemplo: <div class=»entry-meta»>(.*?)<\/div>. Mas explicación al final de esta lista de configuracion de campaña.
  • Strip html tags (opcional), en esta opción le decimos que solo nos permitan estas etiquetas html, lo demas se elimina.
    (<strong><b><a><u><i><h1><h2><h3><h4><h5><h6><a><ul><li><ol><p><table><tr><td><thead><br><pre><code>)
  • Set meta tags as WordPress tags, si tiene etiquetas que no lo marque también.
  • Skip posts with no content, Omitir publicaciones sin contenido.
  • Don’t strip script tags, con esta opción se edita los scripts y etiquetas.

Post Template

  • Post title template: [original_title]
  • Post text template (spintax enabled, like {awesome|amazing|Great}):
  • Ejemplo spintaxt para iniciar la bienvenida y la conclusión.
    {Hola|Muy buenas|Bienvenido}, {soy|me llamo|por aqui} Gabriel y {hoy|esta vez|en esta ocasion|para hoy|aquí} os traigo {este|un|otro} {tutorial|post|nuevo post|nuevo articulo|nuevo tutorial}. [matched_content]
    {Sin mas|Por hoy|Eso es todo}, {me despido|espero que os guste|espero que os haya gustado|hasta la próxima}

Images

  • Set First image/Vid image as featured image
  • Extract the image from the og:image tag (used for facebook thumb)
  • Download images from the post content to my server, se almacena en tu servidor de dominio.
  • -Try to generate names for images from the post title, genera un nombre nuevo para la imagen.

Rewriting, Translation & Multi-language

  • Translate the post before posting: Google Translator
  • From: English to Spanish.
  • ✅ Translate title also, traduce el titulo.
  • ✅ If translation got failed set the post status to Pending, si la traduccion falla lo mande a pendiente.

Content and Searh/Replace & Modifications (opcional)

  • ✅ Search and replace, reemplaza el texto 1 por el texto 2.
  • Ejemplo y modo de uso: texto1|texto2, hacer pruebas si tiene espacios o todo es junto.
  • Ejemplo 2: 2019|2020|titleonly, esto cambiara el año en el titulo y que este activado apply to titles also?

Links

  • Strip original links from the post (hyperlinks), quita los enlaces originales internos. que tenga el post.
  • -Only strip internal links and leave external links, los enlaces externos que los mantenga

Por ultimo le das en publicar, luego «Run Campaign«

Eliminar Contenido que no queres que aparezca en un Post con WpAutomatic

El único es cambia al html es agregar la «\» quedaria al final asi <\/div> sino lo colocas así el código se rompe.

Ejemplos de uso REGEX para limpiar códigos html:

  1. <div class=»entry-meta»>(.*?)<\/div>, elimina todo lo que esta dentro de la clase.
  2. Comienza el texto (.*?) termina por aquí. Elimina todo lo que esta en medio de los texto del comienzo y fin.
  3. Espero te guste el texto escrito por (.*?). Elimina el texto donde comienza hasta que encuentre un punto.
  4. <script>(.*?)<\/scripts>. Elimina todos los scripts que pueda traer wp-automatic.

Webs automáticas desde WordPress paso a paso [4]

Aprende como configurar los meta datos en este apartado.

Códigos REGEX

1. Extraer la meta descripción y fijarla como el excerpt o extracto del post:
regex|og:description» content=»(.*?)»|excerpt|1

Content extraction method

a. Specific extraction to a custom field, excerpt, tags or custom taxonomy, este se usa para extraer la meta descripcion a tu sitio o crear un campo personalizado. Normalmente el código se usa para sitios en español porque del ingles no lo traduce.

Cuando veas la palabra Extract, es extraer.
Y cuando veas la palabra Strip, es eliminar.

b. Strip parts after extracting content using ID or Class, elimina id o clases que no quieres que se vea en tu sitio web. Ver numero 7, y siempre verificar en el codigo fuente, no todas las webs usan la misma clase o id.

c. Set post categories to original post categories, se utiliza para extraer la categoria y ponerlo en el articulo, siempre viendo el codigo fuente para verificar la clase. Ver codigo numero 8.

d. Skip post whiout images, esto sirve para eliminar articulos que no tengan imagenes.

e.Open links copied from the source in new tab (target=»_blank»), los enlaces externos los abre en una nueva pestaña.

f.Add nofollow attribute to links (rel=»nofollow»), les agrega un rel nofollow a los enlaces externos.

g. Set meta tags as WordPress tags, importa las etiquetas de la url original.

2. Extraer el h1 del código fuente:
regex|<h1>(.*?)<\/h1>|mititulo_seo|1

3. Añadir ese custom field en nuestra descripcion SEO:
https://metabox.io/add-custom-fields-to-yoast-seo-meta-tags/
Es decir, usaremos %%cf_<custom-field-name>%% o %%cf_mititulo_seo%%

4.Extraer las meta keywords del código fuente:
regex|<meta name=»keywords» content=»(.*?)»\/>|palabras_clave|1

5. Eliminar cosas:
<div class=»entry-meta»>(.*?)<\/div>

6. Dejar solo ciertos tags html:
<strong><b><u><i><h1><h2><h3><h4><h5><h6><a><ul><li><ol><p><table><tr><td><thead><br><pre><code>

7. Eliminar, por ejemplo, el famoso TOC:
Strip parts after extracting content using Id or Class:
Eliminamos el ID ez-toc-container

8.Convertir una clase del código en nuestras categorías:
Set post categories to original post categories:
Class ast-breadcrumbs

Crea una web automática de noticias y prensa con feeds [7]

Recursos vistos en esta clase:

  1. Scrapebox (Custom Data Grabber)
  2. Códigos feed de WordPress
  3. PublicWWW
    («feed=rss2») («/feed/» «rss»)
  4. Extensión Copy All URLs
  5. Cerveza.gratis

Que es un feed?
Basicamente es como un resumen de la web en formato xml de los ultimos articulos que se han publicado.

Creando campañana en wp automatic

Type: feeds
buscar feed y pegarlo en el cuadro. Revisar que no sea un feed resumido

Rewriting translations:
auto detect – irish – spanish

como quitar clases css?
Marca,strip parts after extracting content.
Class – en el cuardro escribe la clase css y clic en el +.

formato web de los feed:
www.dominio.com/feed