La ignorancia y las Series de Tiempo (I)

La ignorancia y las Series de Tiempo (I)
La peor ignorancia es la del ignorante que ignora que ignora. No es trabalenguas, sino que es la realidad. Un ignorante es aquel que ignora lo que debe saber. Tiene la capacidad de saberlo, tiene la obligación de saberlo, pero no lo sabe: es ignorante. Por ejemplo, yo no soy ignorante de la forma en que los antibióticos trabajan a nivel molecular para eliminar una infección bacteriana. No soy ignorante no porque no lo conozca (de hecho, no lo conozco), sino que no soy ignorante, porque no lo debo conocer, porque no me dedico a eso. Sí sería ignorante, por otro lado, si no conociera cómo calcular una desviación estándar, porque me dedico a eso…
Es decir, puedo ignorar algo sin ser ignorante. Soy ignorante cuando no tengo el conocimiento de algo que debo tener. A veces el ignorante sabe que es ignorante. Pienso que se da cuando uno ha sabido algo, pero luego lo deja descansar el sueño de los justos, porque no lo ha usado en años. Así me pasa a mí con las ecuaciones diferenciales: las estudié en 1984 ó 1985, aprendí los métodos para resolverlas, pero nunca más las he vuelto a estudiar, ni trabajé con ellas profundamente, por lo cual, actualmente me puedo llamar ignorante de ecuaciones diferenciales; de esta ignorancia, padezco muchísimo, porque casi todas las cosas que estudié en Matemática, las he olvidado en un porcentaje muy alto: variable real, topología, ecuaciones integrales, teoría de la medida, variable compleja, etc… Quizá es más seria la ignorancia conocida de algo que sé que existe y debo conocer, pero que no lo conozco. Es decir, ignoro algo y sé que lo ignoro: la llamo yo ignorancia conocida (la verdad ignoro si tiene otro nombre esto, pero así le acabo de poner yo). La ventaja que tiene este tipo de ignorante, es que con un poco de tiempo y estudio, puede dejar de ser ignorante.
Y llego al tercer grado de ignorancia. Que es el peor. Es el ignorante que además de no conocer lo que debería conocer, también ignora que tiene esa ignorancia: es el ignorante que ignora que ignora… es el peor, porque no sale de su ignorancia nunca por sus propios medios, hasta que alguien le restriega en la cara su ignorancia. Porque además, el ignorante en general tiende a ser necio. Según leí hace años, y lo he usado mucho, la palabra necio viene del latín ne-scio, el que no sabe. Uno puede ser terco; pero el necio es el terco ignorante…
Bueno, después de todo este trabalenguas superficial, me parece que es necesario andar por la vida con cachucha de ignorante. O viéndolo positivamente, es necesario andar por la vida con la idea de que no sabemos nada. Y así es. Años ha, de la mano del Sapo Guapo (nuestro profesor de filosofía del Liceo Salvadoreño, hermano de mi estimadísimo amigo Roberto Flores), nos comentó la famosa frase tan manida del gran filósofo griego: “Sólo sé que no sé nada”. Por supuesto que la frase la aprendí en ese lejano 1980, pero la vine a entender como 20 años después, cuando “me cayó el 20”… cuando descubrí que en la medida en que uno sabe más cosas, en esa medida uno se da cuenta de que no sabe casi nada… matemáticamente podríamos decir que el conocimiento de algo es directamente proporcional al conocimiento de la ignorancia sobre el todo. Mientras más cosas estudio, aprendo, sé, comparto, etc., más descubro que no sé casi nada… y eso nos ayuda para andar por la vida tratando de aprender de los demás… a menos que… a uno le entre el gusanito de creerse que ya sabe todo sobre algo o sobre todo… dicen que Hegel comentó, cuando estaba ya madurito: “pobres filósofos que vienen… ya no tendrán nada que hacer de filosofía, porque yo ya la he hecho toda”; no sé si será cierta esta frase, y por supuesto que la frase yo la he escrito directamente, así que no es una frase literal de Hegel…
A qué va todo esto. A que era ignorante sobre las Series de Tiempo… mea culpa. Hace años que había oído hablar sobre las series de tiempo, y había acudido a “mi fuente de información” –Wikipedia-, pero nunca le había entrado en serio al tema. En estos días, estoy preparando unas sesiones (clases) que daré, si Dios quiere, en Uruguay en mayo, tuve que entrarle al tema… una nota técnica que me abre los ojos… y para ver si entendí, trataré de resumirla aquí… si has llegado hasta aquí en mis “autoconsideraciones”, pues te animo a que sigás más adelante, para ver si logro explicar las series de tiempo, traduciendo al español coloquial (parte de mi función de Profesor es traducir o trasladar o transferir o convertir conceptos complejos en sencillos)… Que conste que con la lectura de esta nota técnica no me considero un experto en Series de tiempo, ni mucho menos… sólo que he salido de la ignorancia y estoy contento, y quiero ver si logro explicar bien estos conceptos…
Series de tiempo
Para empezar, las series de tiempo tienen que ver con la estadística. Y como una buena parte de la estadística, tiene que ver con el pasado; con lo que ya transcurrió. Podríamos decir que las series de tiempo son registros históricos de datos estadísticos en una empresa. Son observaciones hechas a intervalos regulares: se anotan, se guardan, y se complementan con datos posteriores. Hace unos días un buen amigo –Luizito- me contó que otro amigo común –David- le había enseñado un lugar donde generarían electricidad mediante pequeñas hidroeléctricas. David había ido durante varios años, cada semana, a medir los caudales de los ríos y quebradas que utilizaría para generar electricidad: todos estos datos son series de tiempo. Son datos en función del tiempo. Hace algunos años también, en Monterrey, un participante me compartió unas series de tiempo de velocidad del viento en una zona determinada de Nuevo León; estaban estudiando la posibilidad de poner generadores eólicos en la zona.
Como puedes ver con estos ejemplos, los datos del pasado pueden ser útiles para tratar de pronosticar el futuro. De hecho, para pronosticar el futuro, las series de tiempo son muy útiles. Si yo quiero generar electricidad como mi amigo David, necesitaré pronosticar cuánta agua tendré en los ríos para generarla, o qué velocidad tendrá el viento en determinado momento, para ver cuánto generaré de electricidad con los “molinos de viento”. De hecho, en la nota técnica que estudié, los datos eran de ventas de carros (coches) en USA. Y tenían datos, series de tiempo del año 1958 al año 1974 (un poco vieja la nota, pero sustancialmente sigue siendo todo lo mismo)…  y los que se trataba era de pronosticar las ventas (es la variable a pronosticar) en el futuro. ¿Te suena interesante? A mí sí me lo parece…
 Ahora bien, esos pronósticos, como todos los pronósticos, no son exactos… qué más quisiéramos. Pero no, todavía no han inventado la máquina que nos daría un 100% de seguridad en nuestros pronósticos. La máquina ya tiene nombre, y todos hemos oído hablar de ella, pero no la han logrado inventar. La máquina para tener seguridad del pronóstico de ventas “futuro” se llama “máquina del tiempo”… sería tan fácil ir al 31 de diciembre de este año, ver las estadísticas de ventas en la empresa, y regresar al pasado, y el pronóstico estaría perfectamente definido.
Pero como eso no existe, ni existirá, tenemos que añadir a la palabra pronóstico, otra palabra que puede sonar a chino a alguien, o pueda dar alergia a otros… el pronóstico que haremos será un pronóstico probabilístico… es decir, nuestro dato de salida –output- será un número de ventas del siguiente año, con una probabilidad de tanto por ciento, es decir, con una seguridad de que se va a vender eso, en un tanto por ciento…
Una vez definida y explicada qué es una serie de tiempo, paso a explicar algo muy importante. Una serie de tiempo, y especialmente si es una de ventas, tiene cuatro factores que le influyen o, mejor dicho, que la hace crecer:
1.       En primer lugar, podríamos distinguir la Tendencia. La serie de datos va creciendo (o decreciendo) siguiendo una tendencia de largo plazo. Esto se le escribe con T.
2.       El segundo elemento que influye en una serie de tiempo es la ciclicidad. Existen una serie de factores cíclicos, que son siempre de largo plazo. Un sector de negocios puede tener crecimientos o decrecimientos durante unos años y luego se revierte la tendencia. Este elemento se escribe con la letra C.
3.       El tercer elemento que influye en una serie de tiempo es estacionalidad. La estacionalidad casi siempre está ligada al clima o a las costumbres. Obviamente se venden más helados durante la época de calor; o se venden más refrescos en Semana Santa y Navidad. O Pavos para la época navideña. Esta estacionalidad es de corto plazo, es relativo a un año. Esta variable ya es, entonces, a corto plazo. A esta variable le llaman S.
4.       El cuarto elemento que afecta a una serie de tiempo es lo desconocido, fluctuaciones residuales o situaciones no diferenciables. Son algunos momentos de crecimiento o decrecimiento que no tienen que ver con los anteriores elementos. Cosas o eventos que no tienen una explicación, o que no se comportan de la misma manera siempre. Esta variable le llaman U.
Para calcular el valor real de la variable de interés (se le llama A) que se está tratando de pronosticar, hace falta, entonces, multiplicar estos cuatro elementos.
A= T * C * S * U
Donde:
A = Valor real de la variable de interés.
T= Nivel de tendencia de la serie a largo plazo.
C= Efecto relativo de los factores cíclicos
S= Efecto de los factores temporales o estacionales.
U= Efecto de los factores sin explicación que el decisor puede considerar como resultantes de “situaciones no diferenciables”.