R
es un programa estadístico. Probablemente sea el programa más comúnmente usado en ámbitos
académicos, pero su uso está creciendo exponencialmente y extendiendo
el tipo de usuarios de académicos a empresariales o gubernamentales, por
ejemplo.
Su ventaja principal
es que se trata de software “open source”. Esto quiere decir que además de ser
gratuito, cualquiera (bueno, cualquiera que sepa un poco de programación) pueda
hacer programitas que funcionen dentro de R, que realicen tareas específicas
que antes no se realizaban o modificar los que ya estaban hechos, y
distribuirlos como “paquetes” que pueden agregarse al programa como extensiones
del mismo. Así hay programas que realizan desde cálculos complejos hasta
gráficos impactantes difíciles de crear con otro software.
Esto hizo que en
los últimos años la actividad de creación y distribución de paquetes explotara
y puede decirse que prácticamente cualquier técnica estadística que uno pueda
leer en una publicación, tiene al menos una implementación en R.
La Farmacovigilancia no se quedó afuera de este
movimiento, ya que existe un paquete específico para realizar detección de
señales llamado “PhViD".
Las desventajas de
R tienen que ver con que su interfase no es amigable ni intuitiva y que si uno
tiende grandes volúmenes de datos (digamos, millones de casos), tiende a
volverse lento e ineficiente. Esto último puede mejorarse mediante algunos
trucos o variantes del programa madre.
Para aquellos a los
que nos gustan los datos, la falta de amigabilidad de R se compensa ampliamente
con la capacidad de hacer prácticamente cualquier cosa.
Si quieren ir
teniendo un panorama de las capacidades gráficas de R, pueden visitar
diferentes galerías que aparecen en Internet, como: http://addictedtor.free.fr/graphiques/
O http://research.stowers-institute.org/efg/R/
Los que quieran tener una idea de todo lo que se puede hacer con R, pueden visitar el excelente blog R-bloggers dedicado solamente a él.
Los que quieran tener una idea de todo lo que se puede hacer con R, pueden visitar el excelente blog R-bloggers dedicado solamente a él.
Bueno, veremos cómo
descargar e instalar R y nociones básicas para operarlo.
Descarga
La página oficial
es http://cran.r-project.org/
Desde ahí puede
descargarse el instalador. Si eligen la versión para Windows, les dará 2
opciones. Deben elegir la “base” y allí los llevará al link para descargar la
última versión.
Instalación
Luego de
descargado, le dan doble click al archivo y siguen las instrucciones. Les
sugiero que acepten todas las opciones que les da por defecto y no se metan a
hacer cambios hasta que conozcan del tema, ya que cualquier opción que hayan
elegido durante la instalación puede luego ser cambiada.
Primeros pasos
Voy a mostrar las
reglas generales para manejarse en R. No se asusten, al principio es bastante
intimidante. Van a ver que después de un rato se van acostumbrando.
Primero que nada,
hagamos una operación básica. Escribimos “2+3” y presionamos “Enter”.
> 2+3
[1] 5
El símbolo “>” está siempre al comienzo de una línea en blanco en la consola, la cual se denomina “línea de comando”, y nos indica en qué lugar escribir.
Lo que sigue son los comandos en sí. Como ven, el hecho de que haya espacios o no entre números y operadores no tiene ninguna importancia. Si están, es para mayor legibilidad.
La segunda línea muestra el resultado de la operación y vemos que consta de 2 partes. La primera parte es “[1]” y solamente indica el número de elemento correspondiente al primero de la línea.
> 2+3
[1] 5
El símbolo “>” está siempre al comienzo de una línea en blanco en la consola, la cual se denomina “línea de comando”, y nos indica en qué lugar escribir.
Lo que sigue son los comandos en sí. Como ven, el hecho de que haya espacios o no entre números y operadores no tiene ninguna importancia. Si están, es para mayor legibilidad.
La segunda línea muestra el resultado de la operación y vemos que consta de 2 partes. La primera parte es “[1]” y solamente indica el número de elemento correspondiente al primero de la línea.
La segunda parte es el resultado en sí, que en este caso es igual a
5.
Ahora bien, seguramente al hacer operaciones más extensas que la
suma anterior querremos guardar el resultado para poder usarlo más tarde. Para
eso se crea un “objeto” que lo contenga. En principio, el concepto de objeto es
similar al concepto de variable. De tal modo, podemos asignar el resultado de
la operación anterior a un objeto de la siguiente manera:
> x=2+3
Ahora “x” contiene el resultado de la operación anterior. Cada vez
que necesitemos usar ese valor, podemos hacerlo usando su nombre o sea “x”:
> x
[1] 5
Podríamos crear otro objeto con otro valor, por ejemplo:
> y=5+8
> y
[1] 13
Y luego hacer operaciones con esos objetos, por ejemplo:
> y-x
[1] 8
Las variables x e y son objetos de R. Los objetos en R pueden
contener todo tipo de elementos y muchas veces contienen varios tipos. Si
queremos ver la lista de objetos que estamos usando en la sesión de R podemos
usar el método “objects” de la siguiente manera:
> objects()
> objects()
[1] "x" "y"
Los métodos
se escriben con paréntesis al final. Vemos que este método nos devuelve la
lista de objetos en memoria, que está constituida por los elementos, “x” e “y”.
El concepto de objeto es bastante complejo en un principio, pero baste decir
que pueden albergar diferente tipo de contenidos, no solamente valores sino
tablas, listados, matrices, funciones y mucho más. Veremos otros alcances del
concepto cuando esto sea necesario.
Para reutilizar comandos anteriores y no tener que tipearlos cada vez que son requeridos, R guarda un historial en memoria. Este
historial puede rememorarse usando las flechas del teclado hacia arriba o
abajo. Cada vez que presionamos hacia arriba aparece la siguiente instrucción
escrita, en el orden inverso en que fueron introducidas. Si queremos
reutilizarla presionamos “Enter”. También podemos editarla antes de utilizarla.
También es importante saber que R es sensible a mayúsculas ("case sensitive"). Por ejemplo, no es lo mismo escribir "Objects()" que "objects()", ni "x" que "X".
También es importante saber que R es sensible a mayúsculas ("case sensitive"). Por ejemplo, no es lo mismo escribir "Objects()" que "objects()", ni "x" que "X".
Lo último que explicaré es que cada vez que abrimos una
sesión de R, se crea un ambiente que se llama “espacio de trabajo” o
“workspace” en inglés. Este workspace contiene todos los objetos y el historial
de comandos utilizados. Al finalizar la sesión, R pregunta si queremos
guardarla, si decimos que sí guarda todo el contenido del workspace y los
objetos estarán allí al reiniciar R.
Si esto les parece interesante, ya saben...
Comenten que es bienvenido. ;-)
Muy claro, gracias!
ResponderEliminar