• Portada
    • Recientes
    • Usuarios
    • Registrarse
    • Conectarse

    [OT] Ayuda con edicion de textos

    Programado Fijo Cerrado Movido
    General
    3
    9
    878
    Cargando más mensajes
    • Más antiguo a más nuevo
    • Más nuevo a más antiguo
    • Mayor número de Votos
    Responder
    • Responder como tema
    Accede para responder
    Este tema ha sido borrado. Solo los usuarios que tengan privilegios de administración de temas pueden verlo.
    • ZuiZ
      Zui
      Última edición por

      Puede parecer una chorrada pero me ahorraria mucho tiempo saber como puedo hacer lo siguiente con algun programa (o lo que sea):

      Resulta que tengo q hacer un trabajo en el que tengo unos textos en este formato (formato FASTA de alineacion de proteinas):

      Bicho 1 ADGFDNBYDGHA…(secuencia de unos 40 aminoacidos)
      Bicho 2 ADGFDNBYDGHA...(secuencia de unos 40 aminoacidos)
      Bicho 3 ADGFDNBYDGHA...(secuencia de unos 40 aminoacidos)
      .
      .
      .
      .
      hasta bicho 40 o 50
      Bicho 1 ADGFDNBYDGHA...(secuencia de unos 40 aminoacidos)
      Bicho 2 ADGFDNBYDGHA...(secuencia de unos 40 aminoacidos)
      Bicho 3 ADGFDNBYDGHA...(secuencia de unos 40 aminoacidos)
      .
      .
      .
      .
      hasta bicho 40 o 50
      ...

      Asi repetido hasta completar la secuencia completa de la proteina que son unos 400 aminoacidos, y necesito pasarlo a otro formato par que me lo reconozca otro programa (formato nexus) que es tal que asi:

      #Begin data;
      Dimensions ntax=[numero de bichos] nchar=[numero de aa];
      GAP=. datatype=protein;
      Matrix
      Bicho 1 ADGFDNBYDGHA…(secuencia completa de unos 400 aa)
      Bicho 2 ADGFDNBYDGHA...(secuencia completa de unos 400 aa)
      Bicho 3 ADGFDNBYDGHA...(secuencia completa de unos 400 aa)
      .
      .
      .
      .

      hasta bicho 40 o 50
      ;
      END;

      Hasta ahora lo he hecho a mano, tardando horas de copy/paste, y estoy seguro de que hay alguna forma mas sencilla asi que si alguien sabe como ayudarme se lo agradecere enormemente.

      Un saludo

      1 Respuesta Última respuesta Responder Citar 0
      • marcaljM
        marcalj
        Última edición por

        Buenas no entiendo la estructura, podrias pegar el archivo, o un cacho del archivo a tratar i decir mejor como esta esto?

        El tema es SUPER SIMPLE haciendo un SCRIPT en BASH, que lo tendrias que ejecutar en una consola bajo Linux.

        Si me explicas un pelin mejor esto te lo hago en un plis, es muy sencillo.

        Mas bien, donde se repite tal cosa, i si esta tabulado perfecto i esas cosas, no el contenido, sino la estructura del archivo a tratar.

        Salu2!

        1 Respuesta Última respuesta Responder Citar 0
        • ZuiZ
          Zui
          Última edición por

          Te pongo un ejemplo de lo que necesito hacer con 3 especies para que lo comprendas mejor (yo es que me explico fatal xD)

          Yo tengo este archivo que me da una base de datos y q solo me sirve para ver la alineacion de aminoacidos en el cual las secuencias no estan seguidas de principio a fin sino que estan partidas en trozos:
          attachment_p_205100_0_ejemplo-alineado.txt

          1 Respuesta Última respuesta Responder Citar 0
          • ZuiZ
            Zui
            Última edición por

            Y lo necesito de la siguiente manera para trabajar con el (el archivo es con extension nex pero le he puesto txt para q lo veas del tiron):

            Como ves esta la secuencia del tiron y no por "capitulos" como el anterior.

            Muchas gracias por la ayuda 🙂
            attachment_p_205102_0_ejemplo-final.nex.txt

            1 Respuesta Última respuesta Responder Citar 0
            • josefuJ
              josefu
              Última edición por

              Buscando a ver si alguien ya había hecho algun programa/script de ese tipo (apt-cache search fasta); me ha salido este programilla: seaview del cual también hay una versión para windows, no se si te valdrá, pero prueba a ver.

              También me ha salido ClustalW que no es un editor y no se muy bien lo que es, a ver si tu que estas más familiarizado con estas cosas lo sabes 😉

              Te pongo la salida de la busqueda para ver si es lo que buscas:

              Seaview

              Description: [Biology] A multiple sequence alignment editor
               This is a graphical editor to deal with biosequences.  SeaView is able
               to read various alignment formats (MSF, CLUSTAL, FASTA, PHYLIP, MASE,
               NEXUS).  It allows one to manually edit the alignment, and also to run
               ClustalW to locally improve the alignment.
              

              ClustalW

              Description: [Biology] Global multiple nucleotide or peptide sequence alignment
               This program performs an alignment of multiple nucleotide or amino
               acid sequences. It recognizes the format of input sequences and whether
               the sequences are nucleic acid (DNA/RNA) or amino acid (proteins). The
               output format may be selected from in various formats for multiple alignments
               such as Phylip or FASTA. ClustalW is very well accepted. An alternative,
               particularly for fragmented sequences, may be
               T-Coffee ([url]http://www.ch.embnet.org/software/TCoffee.html[/url]),
               DIALIGN ([url]http://www.gsf.de/biodv/dialign.html[/url])
               or one of the other many algorithms as summarised on
               [url]http://www.techfak.uni-bielefeld.de/bcd/Curric/MulAli/welcome.html.[/url]
               .
               The output of ClustalW can be edited manually but preferably with an alignment
               editor like seaview or within its companion clustalx.
               When building a model from your alignment, this can be applied for improved
               database searches. The debian package hmmer creates such in form of an HMM.
               .
                URL: [url]ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW/[/url]
                URL: [url]ftp://ftp.ebi.ac.uk/pub/software/unix/clustalw/[/url]
              
              
              1 Respuesta Última respuesta Responder Citar 0
              • ZuiZ
                Zui
                Última edición por

                Ole tus webos tio! te quiero! jajaja, el primer programa me hace las conversiones entre fasta y nexus 😄 que es justo lo que necesitaba. El clustalw lo que hace es alinear secuencias pero eso no me hace falta ya que en las bases de datos ya te las alinean pero aun asi miles de gracias 🙂

                Saludos

                1 Respuesta Última respuesta Responder Citar 0
                • josefuJ
                  josefu
                  Última edición por

                  De nada 🙂

                  1 Respuesta Última respuesta Responder Citar 0
                  • marcaljM
                    marcalj
                    Última edición por

                    joooo, yo k te keria hacer el script too currado… xD

                    Pues nada hombre.

                    Taluegoorl :risitas:

                    1 Respuesta Última respuesta Responder Citar 0
                    • ZuiZ
                      Zui
                      Última edición por

                      Hombre si te quieres currar un pogramilla en español que haga eso tan simple, la comunidad de zoologos españoles te lo agradecera porque de estas cosillas hay pocas y por ahi se puede empezar jejeje 😉

                      Rectifico: hay pocos programitas para windows, para mac si que hay y mucho mas bonitos. Es mas en windows no existe ningun GUI para el programa PAUP (programa tipo consola que en mac es mu bonito pero en windows funciona como un ms-dos cutre) que se lo puedo "enseñar" a alguien interesado y que sepa de esto y hacer uno. Como minimo se hara un nombre entre los zoologos xD

                      1 Respuesta Última respuesta Responder Citar 0
                      • 1 / 1
                      • First post
                        Last post

                      Foreros conectados [Conectados hoy]

                      2 usuarios activos (0 miembros e 2 invitados).
                      febesin, pAtO, krampak

                      Estadísticas de Hardlimit

                      Los hardlimitianos han creado un total de 543.3k posts en 62.8k hilos.
                      Somos un total de 34.7k miembros registrados.
                      sridharpat ha sido nuestro último fichaje.